Указания по формированию базы данных

При формировании базы данных для контрольной работы нужно соблюдать ряд правил.

1. Для формирования необходимой для выполнения контрольной работы базы данных требуется определённый минимум статистической информации – абсолютных показателей или переведённых в относительные величины. Их анализ позволяет получить конкретные результаты, которые дают достаточно объективную и достаточно достоверную характеристику явлений и процессов.

Для сравнений и сопоставлений полезно часть важнейшей информации включить в базу данных в виде абсолютных показателей.

Примером могут служить территориальные параметры и численность населения страны и её регионов, производство важнейших видов продукции (важнейших для страны, важнейших для отдельных регионов), масштабы важнейших ресурсов и т.п.

Абсолютные показатели могут использоваться при оценке потенциалов, расчётов обеспеченности ресурсами, разработке балансов и т.п. В случае необходимости, абсолютные данные могут быть преобразованы в относительные. Однако, необходимо учитывать два обстоятельства. Во-первых, в силу сложившихся традиций, по многим вопросам и аспектам социально-экономического развития информация, выраженная в абсолютных показателях, является практически недоступной для студентов. Кроме того, далеко не всегда данные в абсолютных показателях обеспечивают необходимую сопоставимость явлений или процессов, оказываются недостаточными для выполнения необходимой аналитической работы. Поэтому приходится чаще пользоваться разнообразными относительными данными. Они получаются или путём преобразования имеющихся в распоряжении студентов абсолютных показателей, либо извлекаются из литературы, статистических справочников и т.п.

Практика показывает, что в социально-экономическом планировании и проектировании доля абсолютных показателей не превышает 15-20% генеральной совокупности исходной информации.

2. При формировании исходной базы данных необходимо использовать правило необходимого минимума. При наличии избыточной информации значительная (иногда – подавляющая) её часть остаётся невостребованной. Одновременно практика показывает, что даже при самой избыточной информации в базе данных остаются «белые пятна» - информационные пробелы. Кроме того, избыток исходной информации препятствует её обзору, систематизации и необходимой для выполнения работы выборке. Поэтому при формировании базы данных необходимо на основе плана контрольной работы подготовить предварительный перечень необходимой статистической информации (наименование показателей, базовые годы). В ходе последующего подбора материала и работы с ним будет происходить пополнение базы данных, систематизация и сортировка.

3. Уже при формировании базы данных целесообразно произвести стандартное (согласно правилам арифметики) округление величин. Так, во многих случаях, целесообразно округление величин до целых. Например, рассмотрим генеральную совокупность, составленную четырьмя компонентами: 56,8+22,8+15,6=100. Производим стандартное округление: 57+23+15+6=101. В результате произведённой операции в генеральной совокупности возникает отклонение (невязка), равное единице. Во многих случаях подобным отклонением можно пренебречь, поскольку оно меньше допустимой на практике погрешности расчёта. Так, в градостроительном проектировании при прогнозе численности населения города на перспективу порядка 10-20 лет допустимой считается погрешность расчёта порядка +5%. Это значит, что как практически равные рассматриваются прогнозные величины 95,5 и 104,5 тыс. человек, поскольку обе они лежат в пределах допустимой погрешности расчёта (от 95 тыс. до 105 тыс. человек).

Однако, нередко те же практические (а иногда эстетические) соображения заставляют «разбрасывать» полученную невязку. В этих случаях невязка присоединяется к наибольшим составляющим генеральной совокупности, поскольку тогда возникает наименьшее отклонение от реальной величины. Так, в нашем примере наибольшим компонентом является величина 96 и присоединение к ней полученной невязки (56+1) даст величину 57. Отклонение составляет 1,78%, то есть меньше 2%, следовательно, лежит в пределах допустимой погрешности расчёта. Другая величина – 6. Присоединение к ней невязки даёт величину 7. В этом случае отклонение равно 16,67%, то есть выходит далеко за пределы допустимой погрешности, приобретает существенный характер и меняет представление о величине (масштабе) явления.

4. В составе базы данных целесообразно выделять группы показателей. В настоящее время существуют различные методы математической обработки крупных массивов случайно (или произвольно) собранных данных, позволяющие систематизировать эти данные не только по частным, но и по интегральным признакам. Подобные группировки показателей пригодны для последующего применения широкого спектра методов экономико-математического (в частности, кластерного) анализа. Однако, массив базы данных, используемый в контрольной работе, обычно не столь велик, чтобы требовать применения сложных методов. Поэтому при формировании групп показателей наиболее применимы два принципа. Во-первых, группы следует выделять путём включения в них функционально однородных показателей (или их систем). Например показателей, позволяющих дать комплексную динамическую характеристику социально-экономического развития регионов. Решив эту задачу, студент получает возможность сопоставить особенности развития регионов, темпы, масштабы и пропорции развития. На этой основе становится реальной разработка предложений по совершенствованию различных сторон региональной политики в контексте темы контрольной работы.

5. Распространённым, но ошибочным, является представление о том, что база данных должна формироваться только за счёт количественных показателей (преимущественно - статистических), относительно легко поддающихся формализации и последующей математической обработке.

На самом деле, важную роль при формировании базы данных для выполнения контрольной работы не только может, но и должно играть накопление фактического материала. При наличии достаточного массива такой информации возможно применение методов формализации и последующей группировки фактов для целей социально-экономической интерпретации. Наиболее распространёнными среди методов формализации являются методы классификационных и типологических группировок.

Фактический материал и его интерпретация приобретают особое значение при дефиците репрезентативной количественной информации или при полной её сопоставимости.

Например, методики расчёта себестоимости производства и издержек производства не вполне идентичны. Их сравнение и последующая интерпретация могут быть облегчены за счёт использования дополнительных сведений о тарифной политике, дальности перевозок сырья, топлива и готовой продукции и т.п.

Так, можно иметь все экономико-стратегические материалы по Печорскому каменноугольному бассейну, но правильные выводы о возможностях его развития будут сделаны только, если окажутся учтёнными: а) перспективы перевода тепловой энергетики Ленинградской и Вологодской областей на местное топливо (сланцы, торф); б) перспективы развития Череповецкого металлургического комбината; в) ожидаемые масштабы использования энергетических углей на печорской железной дороге.

Если вести речь об отдалённых перспективах развития бассейна, то необходимо учитывать возможности строительства Урало-Печорской и Северо-Сибирской железных дорог и освоения Северного морского пути.