Критика Линка Уоллеса.
Разность средних > К * (сумма размахов)
n
Разность средних значений для любых двух групп.
Если неравенство выполняется, то различие между средними статистически значимы. Разность средних берётся по модулю.
Сравним средние значения в обычной школе и школе-интернате
4,750 = 4,625 = 0,125
0,125 > 1,18 * 17 = 2,507.
Неравенство не выполняется. Следовательно статистически значимых различий между средними значениями в обычной школе и школе-интернате нет.
Проверим различие между средними значениями в обычной школе и колледже.
<…>
3 > 2,5 (неравенство выполняется).
Средние значения в интернате и в колледже.
3,125 > 2,5 (тоже выполняется).
Таким образом средний показатель количества решёных задач достоверно выше в интернате и в колледже.
Надёжность метода расщепления.
Процедура расщепления позволяет разбить тест на 2 составляющие части: чётные задания и нечётные задания. Для определения надёжности применяется формула Спирмена-Брауна:
Rp = 2 Rn_
1 - Rn
Рюлона:
Rp = 1 - σ2
σx2
Rp–коэффициент надёжности полного теста.
Rn – коэффициент надёжности для половины теста.
Эта формула справедлива при равных стандартных отклонениях в обеих половинах теста. Если стандартные отклонения равны, тогда пользуемся формулой Рюлона, где:
σ2 – дисперсия разностей между результатами половин теста.
σx2 –дисперсия суммарного результата.
Главное преимущество метода расщепления по сравнению с ретестовым методом и методом параллельных форм, это отсутствие необходимости повторного тестирования. Устраняется влияние запоминания заданий. Недостаток метода: невозможность определить устойчивость по временным факторам.
Обе формулы справедливы для однородных тестов, если тест разнородный. Например, тест структуры интеллекта Амтхауера, тогда расщепление приводит к искажению результатов. В этом случае определяется надёжность каждого отдельного задания теста. Для этого используют формулы Кьюдера –Ричардсона, в которой подставляют данные о выполнении испытуемыми каждого задания:
Rn = N * (1 - Σp * g)
N – 1 σx2
где:
N – число задач в тесте.
σx2 – дисперсия первичных оценок теста.
p – индекс трудности заданий.
p – доля испытуемых справившихся с заданиями.
g = 1 – p.
g – доля испытуемых не справившихся с заданиями.
N задачи | Количество | p | g | pg |
0,96 | 0,14 | 0,04 | ||
0,86 | 0,14 | 0,12 | ||
0,66 | 0,34 | 0,22 | ||
0,78 | 0,22 | 0,17 | ||
0,56 | 0,44 | 0,25 | ||
… | … | … | … | … |
0,02 | 0,98 | 0,02 | ||
0,02 | 0,98 | 0,02 | ||
Σ | 2,55 |
σx2 = 8,01