Принятие решений в неопределенности стр.229

Так как PIP была явно лучшей, a POP была следующей, я представлю только сравнение между ними. (PUP была третьей, а РЕР, самый близкий результат, к тому способу, которым обработка информации происходит сейчас, была худшей.) Рис.З показывает заключительные шансы, после 60-го условия данных в каждом сценарии, в пользу каждой войны по сравнению с миром для PIP и для POP. Две самые важные вещи, которые нужно заме тить на графике - это то, что эти две группы очень хорошо согласуются качественно (корреляция между ними - 0.895), но они не согласуются количественно. PIP намного более подвержена влиянию данных, чем POP; тот же самый сценарий, который приведет PIP к тому, что он будет очень уверенным относительно мира или войны, приведет POP, к намного меньшей уверенности. Иными словами, PIP - менее консервативна, чем POP, возможно, потому что в POP, субъекты должны объединить данные, в то время как в PIP, испытуемые оценивают диагностическое воздействие каждой данной величины отдельно, и теорема Байеса делает их соединение.

Вы должны также обратить внимание, что обе оси на рис. 3 логарифмически разделены. Если Вы переводите различие в эффективности обратно в шансы, различие между PIP и POP становится очевидным. Например, вычисление, исходя из линии регресса, привел ли сценарий PIP к тому, чтобы дать 99:1 шансы в пользу войны над миром, POP дал бы только 4:1 (шансы) в пользу этой войны, а не мира.

Рис. 4. Медианные апостериорные шансы для всех испытуемых в пользу начального множества как функции количества испытаний

Гипотеза неправильного восприятия не может объяснить это несоответствие между PIP и POP, в PIP испытуемые оценивают диагностическое воздействие каждой данной величины отдельно; в POP испытуемые должны объединить в уме - и сделать это весьма консервативно. Так как никакая модель процесса порождающего данные не доступна, невозможно сказать каковы правильные апостериорные шансы. Но различие между PIP и POP явно вызвано различием в процессе агрегации.

Лэрри Филлипс, один из сотрудников в этом эксперименте, был заинтересован тем, что никакая модель процесса порождающего данные не была доступна и, так что нельзя было сказать с уверенностью, был ли PIP или ЮР более правилен. Так в своей докторской диссертации он сравнил PIP с ЮР в ситуации, в которой модель процесса порождающего данные была доступна, имело смысл спросить сотношение вероятности для отдельной данной величины, и процедура ЮР произвела консервативные оценки. Его испытуемые были редакторами студенческой газеты Мичиганского Университета. Он взял статьи каждого редактора в течение семестра, посчитал две первые и последние буквы в каждом слове каждой статьи, и таким образом, для каждого редактора подготовил множество начальных биграмм и множество конечных биграмм. Для задачи PIP, он взял определенные биграммы, и попросил редактора оценить (только для его собственного множества) отношение вероятности, взятое с гипотезой множества начальных биграмм в числителе и гипотезой множества конечных биграмм в знаменателе, связанное с каждой биграммой. Для задачи POP, он подготовил последовательность биграмм, выбранных из одного из множеств, и спросил редактора, когда он прорабатывал последовательность, оценить апостериорные шансы, что это было начальное, а не конечное множество. Много усилий было потрачено на предварительное обучение редакторов, и оценки отношения вероятности были собраны дважды, один раз до и один раз после апостериорных оценок шансов.

В анализе данных возникла проблема, потому что все оценки, и для PIP, и для ЮР, были смещены в пользу начального множества. Это вероятно, потому что намного легче, например, думать о словах, которые начинаются на те, чем о словах, которые заканчиваются на ге, даже при том, что ге скорее встречается как окончание, чем как начало слова; мы приучены к маркировке слов по их началам, а не окончаниям, когда мы, например, ищем их в словаре. Однако, возможно исправить такие предубеждения. Рисунок 4 показывает результаты после такого исправления. Действительные шансы, подсчитанные из фактического счета биграмм, являются наиболее эк-стремумными. Затем идут шансы, подсчитанные из второго набора оценок отношения вероятности. Затем идут шансы, подсчитанные из первого набора оценок отношения вероятности. И, наиболее близкими к середине и поэтому наиболее консервативными, являются непосредственно оцененные апостериорные шансы. Если мы верим этим данным (а я верю), хотя PIP значительно менее консервативен, чем POP, он все-таки слишком консервативен, но оценки PIP улучшаются с практикой.


⇐ назад к прежней странице | | перейти на следующую страницу ⇒