Правило построения интервальных оценок для парного и частного коэффициентов корреляции.

Если для двумерной корреляционной модели коэффициент корреляции значим, то имеет смысл найти для него интервальную оценку (построить доверительный интервал). Плотность вероятности выборочного коэффициента корреляции имеет сложный вид, поэтому используют специально подобранные функции от выборочного коэффициента корреляции r, которые подчиняются хорошо изученным законам распределения, например нормальному закону. Чаще всего используют z - преобразование Фишера: Z=1/2ln(1+r/1-r) Величина z при n > 10 распределена приблизительно нормально, причем MZ=1/2ln(1+p)/(1 –p) По таблице z - преобразования Фишера выборочного коэффициента корреляции r находят ему соответствующее zr и строят интервальную оценку для MZ. Доверительные интервалы для неизвестных коэффициентов с уровнем доверия гамма =(1-α) определяются по формуле: тема 8 нумерация слайда с 15 по 16 слайд

 

14. Что такое фиктивные переменные, и в каких задачах их используют.При построении модели регрессии может возникнуть ситуация, когда в неё необходимо включить не только количественные, но и качественные переменные (например, возраст, образование, пол, расовую принадлежность и др.).

Фиктивной переменной (dummy variable) называется атрибутивный или качественный фактор, представленный посредством определённого цифрового кода.

Наиболее наглядным примером применения фиктивных переменных является модель регрессии, отражающая проблему разрыва в заработной плате у мужчин и женщин.

Предположим, что на основе собранных данных была построена модель регрессии, отражающая зависимость заработной платы рабочих y от их возраста х:

yt=β0+β1xt.

Однако данная модель регрессии не может в полной мере охарактеризовать вариацию результативной переменной. Поэтому в модель необходимо ввести дополнительный фактор, например пол, на основании предположения о том, что у мужчин в среднем заработная плата выше, чем у женщин. В связи с тем, что переменная пола является качественной, её необходимо представить в виде фиктивной переменной следующим образом: С учётом новой фиктивной переменной модель регрессии примет вид:

y=β0+β1x+β2D,

где β2 – это коэффициент, который характеризует в среднем разницу в заработной плате у мужчин и женщин.