Анализ программного обеспечения

 

Анализ программного обеспечения для решения задачи прогнозирования инвалидности основывается на изложенных выше результатах анализа математических методов.

Все статистические расчеты проводятся с использованием специального программного обеспечения. Для первичной обработки исходных статистических данных, представленных в форме таблиц, наиболее целесообразно использовать табличный процессор Excel, функционирующий в операционной среде WINDOWS. Этот выбор обусловлен следующими причинами:

1. Excel позволяет представить данные в табличной форме, что делает информацию наглядной и значительно облегчает расчеты.

2. Excel позволяет легко конвертировать данные в форматы других баз данных.

3. Excel позволяет работать с большими таблицами данных.

4. Excel значительно облегчает проведение многочисленных однотипных расчетов для большого числа данных.

5. Графические возможности Excel облегчают выявление закономерностей и интерпретацию результатов.

6. В Excel хорошо представлены универсальные методы для первичного статистического анализа данных.

7. Русскоязычная версия Excel позволяет проводить обработку данных не только профессионалам-математикам, но и специалистам других областей, так как в ней имеется удобный справочник по используемым статистическим процедурам.

8. Широкая распространенность и доступность Excel.

Однако для более полного и детального статистического анализа информации в дополнение к Excel следует использовать также пакет программ статистической обработки, предоставляющий значительно более широкий выбор процедур, которые позволят глубже изучить природу данных, обнаружить связи между переменными и изучить структуру этих связей. На этапе первичной обработки информации такой пакет программ играет вспомогательную роль, а на этапе вторичной обработки становится основным инструментарием.

Как известно, выбор программного обеспечения для анализа данных зависит от характера решаемых задач, объема обрабатываемых данных, квалификации пользователей, имеющегося оборудования и т.д.
Поскольку в рассматриваемой нами задаче объем данных можно считать умеренным и предполагается использование в основном стандартных методов статистической обработки данных, то целесообразно использовать универсальный пакет программ статистической обработки.

Из зарубежных систем, наиболее распространенных в нашей стране, рассмотрим возможности STATGRAPHICS, SyStat и SPSS. В системах SyStat и SPSS реализован широкий набор вычислительных методов. В них имеется встроенный командный язык, позволяющий решать сложные задачи обработки данных. Однако изучить и использовать возможности этого командного языка непросто. Кроме того, система SPSS больше подходит для анализа качественных переменных. В нашей же задаче все переменные носят исключительно количественный характер. Пакет программ STATGRAPHICS, в отличие от SyStat и SPSS, содержит наибольшее количество методов статистического анализа. Так, например, в нем значительно больше представлено возможностей для анализа закона распределения. К достоинствам этой системы можно также отнести хорошую двухмерную и трехмерную графику. Этот пакет программ довольно долго занимал одно из лидирующих мест в мире (5). К “недостаткам“ системы следует отнести то, что она рассчитана на специалистов, хорошо знакомых с концепциями применяемых процедур. Однако сегодня этот недостаток компенсируется удачно представленной в литературе (3) методикой использования СПП STATGRAPHICS.

Из новейших зарубежных статистических пакетов можно назвать SPSS и STATISTICA 5.0 для WINDOWS, которые позволяют значительно ускорить анализ данных благодаря мощному интерфейсу WINDOWS, располагающему богатейшими графическими возможностями, а также благодаря расширенному набору статистических процедур. Эти пакеты незаменимы для анализа больших объемов данных (в системе STATISTICA можно анализировать до 32000 переменных).

Из отечественных систем были исследованы возможности таких наиболее распространенных пакетов как Эвриста, Мезозавр и STADIA. Эвриста и Мезозавр относятся к специализированным пакетам, предназначенным для анализа временных рядов и регрессионного анализа. В них очень слабо представлены графические возможности, методы анализа закона распределения, непараметрические тесты. Пакет STADIA по своим возможностям сопоставим с пакетом STATGRAPHICS (3).

В результате проведенного анализа для решения поставленной задачи был выбран статистический пакет программ STATISTICA, что обусловлено богатыми графическими возможностями пакета, реализацией большого набора статистических методов, возможностями обмена данными с Excel и возможностью включения данных, расчетных показателей и графиков в отчет, который может быть сформирован, например, с помощью текстового редактора WORD.