Гнездовые logit-модели (nested logit-models).

Как было отмечено, в условной logit-модели ошибки обычно предполагаются гомоскедастичными. Для практики это предположение часто является слишком строгим. Например, в случае выбора одного из трех торговых центров при условии, что количество магазинов в первом из них вдвое больше, чем во втором (K1=2K2), а расстояние до первого вдвое больше, чем до второго (Rt1=2Rt2), дисперсии ошибок e1 и e2 эконометрической модели, связывающей данные выбора первого и второго торгового центра с влияющими на этот выбор факторами (см. выражение (10.96)), определяются следующим образом:

 

 

где T – число наблюдений.

Если , то D(e1D(e2), т. е. ошибки ej гетероскедастичны.

Один из способов ослабить предположение о гомоскедастичности ошибок в условной logit-модели связан с изменением процедуры выбора альтернативных вариантов. В этом случае варианты разделяются на непересекающиеся группы таким образом, что внутри группы дисперсии ошибок etj уравнения (10.84) являются одинаковыми, а дисперсии ошибок разных групп между собой различаются.

Предположим, что J вариантов могут быть разбиты на L групп, и общий набор вариантов представляется как [1,...,J]=[(1|1,...,J1|1),..., (1|L,..., JL|L)], где j|lj вариант в группе l, Jl – номер последнего варианта в группе l. Используется следующая логика выбора окончательного решения. Сначала выбирается одна из L групп, затем осуществляется выбор варианта в рамках группы. Этот процесс имеет древовидную структуру, которая для двух групп и 5 вариантов может выглядеть следующим образом:

 

Выбор

 
 


Группа1 Группа2

 
 


1|1 2|1 1|2 2|2 3|2

 

Пусть хj|l – вектор независимых переменных, влияющих на выбор варианта внутри группы, а zl – вектор независимых переменных, влияющих на выбор группы.

Если бы для описания процедуры выбора использовалась условная logit-модель (10.92), то предполагалось бы, что выбор варианта j и выбор группы l не зависят друг от друга.

При условии независимости выбора группы и варианта внутри группы вероятность выбора конкретного варианта определялась бы следующим выражением:

где a и g – вектора параметров.

Для гнездовой logit-модели безусловную вероятность выбора j-го варианта и l-й группы можно представить как произведение условной вероятности выбора j-го варианта при условии, что была выбрана l-я группа, и безусловной вероятности выбора l-й группы.

Заметим, что поскольку внутри группы ошибки гомоскедастичны, то условную вероятность выбора j-го варианта при условии выбора l-й группы, можно определить с использованием выражения (10.92) как

 

 

Специфика гнездовой logit-модели, ее отличие от условной logit-модели, состоит в подходе к определению вероятности выбора l-й группы. Для того чтобы раскрыть эту специфику, введем переменную Il, характеризующую “ценность” l-й группы:

 

В гнездовой logit-модели “ценность” l-й группы рассматривается как дополнительный фактор, влияющий на выбор этой группы, т. е. вероятность выбора l-й группы определяется следующим образом:

 

где tl – параметр, который и отличает гнездовую logit-модель от условной logit-модели. В последней он принимает значение 1. Поэтому вероятность выбора l-й группы в условной logit-модели определяется как

 

В гнездовой logit-модели значение параметра tl оценивается вместе с параметрами g.

В целом, оценивание безусловной вероятности выбора j-го варианта внутри l-й группы в рамках гнездовой модели осуществляется следующим образом:

1. Вектор параметров a оценивается с использованием условной logit-модели типа (10.92), описывающей выбор j-го варианта в зависимости от факторов хj|l. После оценки параметров a по формуле (10.103) определяется ценность l-й группы, т. е. Il.

2. Вектор параметров g и параметр tl также оцениваются с использованием условной logit-модели типа (10.92), которая описывает выбор l-й группы в зависимости от факторов zl и Il.

3. По формулам (10.103), (10.105) оцениваются вероятности Pj|l и Pl. Безусловная вероятность выбора j-го варианта внутри l-й группы определяется как произведение Pj|l и Pl.

Качество оценок, получаемых на основе гнездовой logit-модели, во многом определяется правильностью построения дерева альтернативных вариантов. Отметим, что на практике достаточно трудно оценить, соответствует ли выбранная структура такого дерева исходным условиям модели, состоящих в постулировании определенных допущений относительно дисперсий ошибок (постоянство дисперсий ошибок внутри группы и различие дисперсий в разных группах).

Как это было показано ранее, модификации logit-моделей могут формироваться в зависимости от состава учитываемых в них факторов. В частности, мультиномиальная logit-модель в отличие от рассмотренных выше модификаций учитывает, что на выбор индивидуума t влияют только его характеристики. Примером мультиномиальной logit-модели является модель выбора сферы деятельности (Schmidt and Strauss, 1975). Допустим, что имеется информация: а) относительно возможной сферы деятельности человека: (0) – “прислуга”, (1) – “синий воротничок”, (2) – “ремесленник”, (3) – “белый воротничок”, (4) – “руководитель”; б) относительно характеристик индивидуума (факторов): образование, опыт работы в данной области, пол.

Предположим, что значения зависимой переменной yt и независимых факторов wt, связаны следующим образом:

 

yt=aj¢×wt +etj, (10.107)

 

где ytнаблюдаемые значения зависимой переменной (т. е. 0, 1,...,J); wt – вектор факторов, содержащий характеристики индивидуума t; aj – вектор параметров, характеризующих влияние факторов wt на выбор конкретного варианта j, etj – ошибка модели.

Предположим также, что ошибки etj, j=1,...,J независимы и распределены по закону Вейбулла, т. е.

Тогда вероятность выбора t-м индивидуумом j-го варианта может быть представлена в следующем виде (см. выражения (10.89)–(10.91)):

 

Заметим, что в приведенном примере рассматривается нулевая альтернатива. Это позволяет сократить объем вычислений, поскольку на практике a0 не оценивают, а принимают равным нулевому вектору. Тогда согласно выражению (10.108) вероятности выбора t-м индивидуумом варианта j, j=0,1,..., J–1; определяются согласно следующим формулам:

 

 

Из выражений (10.109) следует, что логарифм отношения вероятностей выбора j-й и 0-го варианта равен

 
 


aj¢×wt×, (10.110)

 

а логарифм отношения вероятностей выбора j-го и k-го вариантов –

 
 


wt¢×(ajak). (10.111)

 

Заметим, что, если предположение о независимости ошибок etj не выполняется, то соотношения между вероятностями нуждаются в определенной корректировке.