LINEBURG


страница 1
(всего 4)

ОГЛАВЛЕНИЕ

След. стр. >>

Библиотека
<Математическое просвещение>
Выпуск 25




С. М. Гусейн-Заде

РАЗБОРЧИВАЯ
НЕВЕСТА




Издательство Московского центра
непрерывного математического образования
Москва • 2003
УДК 519.216
ББК 22.171
Г96
Аннотация
Примерно 40 лет тому назад М. Гарднер придумал такую за-
дачу: <В некотором царстве, в некотором государстве пришло вре-
мя принцессе выбирать себе жениха. В назначенный день явились
1000 царевичей. Их построили в очередь в случайном порядке
и стали по одному приглашать к принцессе. Про любых двух пре-
тендентов принцесса, познакомившись с ними, может сказать, ка-
кой из них лучше. Познакомившись с претендентом, принцесса
может либо принять предложение (и тогда выбор сделан навсегда),
либо отвергнуть его (и тогда претендент потерян: царевичи гор-
дые и не возвращаются). Какой стратегии должна придерживаться
принцесса, чтобы с наибольшей вероятностью выбрать лучшего?>.
В 1965 году формулировку этой задачи и её решение расска-
зал на своём семинаре Е. Б. Дынкин. Но его метод был необоб-
щаем на другие варианты задачи: например, когда целью являет-
ся выбор не наилучшего, а одного из трёх лучших. В таком виде
задача была решена автором при помощи метода, который легко
переносится и на ряд близких задач. Так из полушуточной зада-
чи вырос новый раздел математики — т е о р и я о п т и м а л ь-
н о й о с т а н о в к и с л у ч а й н ы х п р о ц е с с о в.
Текст брошюры представляет собой обработку записи лек-
ции, прочитанной автором 30 ноября 2002 года на Малом мехмате
МГУ для школьников 9—11 классов (запись Ю. Л. Притыкина).
Брошюра рассчитана на широкий круг читателей: школьни-
ков, студентов, учителей.
Издание осуществлено при поддержке
Департамента образования г. Москвы
и Московской городской Думы.

ISBN 5-94057-076-3 © С. М. Гусейн-Заде, 2003.
© МЦНМО, 2003.

Сабир Меджидович Гусейн-Заде.
Разборчивая невеста.
(Серия: <Библиотека ,,Математическое просвещение“>. Вып. 25).
М.: МЦНМО, 2003. — 24 с.: ил.
Редактор Ю. Л. Притыкин.
Художник А. Ю. Шамшурина. Техн. редактор М. Ю. Панов.

Лицензия ИД № 01335 от 24/III 2000 года. Подписано в печать 14/VII 2003 года.
Формат бумаги 60?88 116 . Бумага офсетная № 1. Печать офсетная. Физ. печ. л. 1,50.
/
Усл. печ. л. 1,47. Уч.-изд. л. 1,44. Тираж 3000 экз. Заказ 2711.

Издательство Московского центра непрерывного математического образования.
119002, Москва, Г-2, Бол. Власьевский пер., 11. Тел. 241 72 85, 241 05 00.

Отпечатано с готовых диапозитивов
в ФГУП <Производственно-издательский комбинат ВИНИТИ>.
140010, г. Люберцы Московской обл., Октябрьский пр-т, 403. Тел. 554 21 86.
Невеста-девушка смышляла жениха;
Тут нет ещё греха,
Да вот что грех: она была спесива.
Сыщи ей жениха, чтоб был хорош, умён,
И в лентах, и в чести, и молод был бы он
(Красавица была немножко прихотлива):
Ну, чтобы всё имел. Кто ж может всё иметь?
Ещё и то заметь,
Чтобы любить её, а ревновать не сметь.
Хоть чудно, только так была она счастлива,
Что женихи, как на отбор,
Презнатные катили к ней на двор.
Но в выборе её и вкус и мысли тонки:
Такие женихи другим невестам клад,
А ей они на взгляд
Не женихи, а женишонки!
Ну, как ей выбирать из этих женихов?
И. А. Крылов
Разборчивая невеста

Речь в данной брошюре пойдёт о задаче, которая, с одной сто-
роны, достаточно элементарна, чтобы её можно было рассказать
от начала и до конца, и, с другой стороны, была придумана не ко-
гда-то там в девятнадцатом веке или раньше, а во вполне обозри-
мом прошлом, в веке двадцатом, причём положила начало новому
разделу теории вероятностей или даже прикладной теории вероят-
ностей, который называется теорией оптимальной остановки слу-
чайных процессов. История этой задачи такова. В 1960 году её при-
думал Мартин Гарднер, автор огромного количества книг с увлека-
тельными задачами и головоломками, связанными с математикой.
Его можно назвать популяризатором математики. Оказалось, что
на тот момент эта задача в теории вероятностей не рассматривалась.
В 1963 году её решил Евгений Борисович Дынкин, замечательный
математик, а также известный организатор сначала вечерних мате-
матических кружков, а потом и математических классов в школе,
сегодня имеющей название <Лицей ,,Вторая школа“>. Я расскажу
прямо ту задачу, которую решил Дынкин, так как это самый про-
стой вариант формулировки, а вот его метод решения предназначен
только для этой задачи и не работает в самых простых обобщениях.
В 1966 году под влиянием и по совету того же Дынкина я занял-
ся этой задачей и нашёл решение в достаточно общем виде. Позже
с этой задачей оказался связанным очень известный в современной
России человек, фамилия которого Березовский. Борис Абрамо-
вич Березовский известен как бизнесмен и политический деятель,
но когда-то он был математиком и защитил докторскую диссерта-
цию по проблемам, связанным как раз с обобщениями этой задачи.
Теперь я расскажу саму задачу, ровно так, как её формулиро-
вал Гарднер. Это задача о разборчивой невесте. Пусть в некотором
царстве, в некотором государстве принцесса решила, что ей по-
ра найти себе жениха. Созвали царевичей и королевичей со всего
3
света, и явилось 1000 претендентов. Про любых двух когда-либо
увиденных принцесса может сказать, кто из них лучше. При этом
царевичи, как говорят математики, образуют упорядоченное мно-
жество, т. е. если Иван Царевич лучше Василия Царевича, а Ва-
силий Царевич лучше Фёдора Царевича, то Иван Царевич лучше
Фёдора Царевича. Претенденты входят к принцессе по очереди,
по одному, причём их порядок определён случайным образом, т. е.
вероятность появления какого-то царевича первым, или пятисо-
тым, или тысячным совершенно одинакова. Принцесса, разумеет-
ся, умея их сравнивать, может сказать, что, например, вошедший
тридцатым является десятым по качеству, т. е. девять из предыду-
щих были лучше, а остальные — хуже, и т. д. Цель принцессы —
получить самого хорошего жениха, т. е. даже второй её не устраи-
вает. На каждом шаге, т. е. после встречи с каждым из царевичей,
она решает, берёт ли она его в мужья. Если берёт, то на этом смотр
претендентов заканчивается, они все разъезжаются по домам.
Если же принцесса ему отказывает, то царевич, будучи отвергну-
тым, тут же уезжает домой, потому что все царевичи и королеви-
чи — люди гордые. Показ претендентов на замужество при этом
продолжается. Если в конце концов принцесса не получает лучшего,
то считается, что она проиграла, выходить замуж вообще не будет,
а уйдёт в монастырь (про монастырь я уже от себя придумал, у Гард-
нера этого не было). Спрашивается, как действовать принцессе,
чтобы с наибольшей вероятностью получить лучшего жениха.
В основе решения задачи заложен простой принцип, имею-
щий громкое название <динамическое программирование>. На са-
мом деле это просто планирование, решение задачи с конца. Сей-
час я поясню, что имеется в виду. Предположим, что принцесса
пропустила 999 претендентов и сейчас встречается с последним.
Тогда у неё нет никакой альтернативы, всё совершенно ясно. Если
последний и есть самый лучший, то принцесса выиграла, добилась
своего, если он не самый лучший, то принцесса проиграла и ухо-
дит в монастырь. В любом случае отвергать последнего претенден-
та бессмысленно, это к победе точно не приведёт. Теперь предпо-
ложим, что принцесса знает, как вести себя на 601-м шаге. Попро-
буем понять, что делать при встрече с 600-м, т. е. за шаг до этого.
Ясно, что если 600-й претендент не лучше всех предыдущих, то
и думать нечего, ему нужно отказывать. Вообще в нашей задаче
принцесса будет останавливаться только на тех, кто лучше всех
предыдущих, иначе она точно проиграет, ведь её устраивает только
самый лучший. Если же он действительно лучше всех предыдущих,
то у принцессы есть выбор. Например, когда приходит первый, то,
естественно, он лучше всех предыдущих, так как и предыдущих-то
никаких не было, но останавливаться на нём как-то очень странно,
шансов победить мало, с таким же успехом можно и на десятом
4
остановиться, лучше ещё подождать хоть немного, может, кто-ни-
будь получше появится. Итак, пусть 600-й лучше всех предыдущих,
и принцессе нужно оценить (она, наверное, и не может, но ведь
для этого математики и существуют), что лучше: выбрать этого
самого 600-го или отказать ему, перейти к следующему, а там,
как мы помним, уже всё известно, понятно, как нужно поступать,
и шансы на получение лучшего жениха мы посчитать сможем.
Итак, объявим для начала, что 1000 мы обозначим за n, т. е.
решим задачу для произвольного количества претендентов. Далее,
пусть принцесса находится на шаге t (это номер шага, т. е. на-
туральное число). Первое, что ей нужно знать — это вероятность
победы в случае выбора жениха в момент t, при условии, что он
лучше всех предыдущих, т. е. вероятность того, что он не только
лучше всех предыдущих, а вообще лучше всех. Обозначим эту ве-
роятность за gt . Кроме того, необходимо знать ещё одну величи-
ну — это вероятность того, что она в конце концов получит самого
хорошего жениха, при условии, что она пропустит первых t пре-
тендентов и дальше будет пользоваться оптимальной стратегией
(здесь подразумевается наше предположение о том, что принцесса
знает, как себя оптимально вести начиная с шага t+1, это и есть
принцип, используемый в динамическом программировании). Обо-
значим эту вероятность за ht . Зная эти две величины для любо-
го t, мы можем легко понять оптимальную стратегию поведения
для принцессы: если на шаге t претендент не лучше всех преды-
дущих, то, ясное дело, его нужно отвергнуть, если же он действи-
тельно лучший среди первых t претендентов, то нужно сравнить gt
и ht , если больше gt , то нужно остановиться на претенденте t, ес-
ли больше ht , то нужно его отвергнуть и перейти к следующему,
такая стратегия следует прямо из определения этих вероятностей.
Что же делать в случае равенства? Понятно, что это неважно, так
как вероятность победы в каждом из случаев одинакова, поэтому
давайте договоримся, что в случае равенства gt и ht принцесса бу-
дет, например, всё время останавливаться на текущем претенденте.
Стратегия нами уяснена, осталось только посчитать gt и ht .
Вероятность gt я посчитаю прямо сейчас, явно, а ht пока считать
не буду, только скажу достаточно очевидный факт о том, как эта
вероятность себя ведёт в зависимости от t.
Итак, посчитаем gt . Начнём, как и было обещано, считать
с конца, т. е. сначала посчитаем gn , потом gn?1 , и т. д., заполняя


gt

t n?3 n?2 n?1 n
Рис. 1
5
1
gt

t n?3 n?2 n?1 n
Рис. 2

таблицу на рис. 1. Итак, если на шаге n претендент оказался луч-
ше всех предыдущих, то какова вероятность того, что он действи-
тельно самый лучший среди всех претендентов? Сто процентов,
или единица (рис. 2; кстати, вероятность можно мерить в процен-
тах, но проценты — это те же доли, а именно, сотые доли, поэто-
му вероятность также меряют в долях от единицы). Далее, пусть
принцесса оказалась на шаге n?1, и перед ней предстал претен-
дент, который лучше всех предыдущих. Какова же будет вероят-
ность проигрыша в случае, если принцесса его выберет? Это бу-
дет вероятность того, что последний, n-й царевич окажется лучше
всех. Но давайте представим всех царевичей и королевичей упоря-
доченными по возрастанию <хорошести>, <качества> (как мы по-
мним, по условию это можно сделать). Поскольку царевичи равно-
вероятно разбросаны по этому списку (что тоже следует из усло-
вия), то вероятность самого хорошего претендента оказаться на n-м
месте (т. е. как раз вероятность проигрыша) точно такая же, как
оказаться на 1-м, на 57-м, на 600-м или на любом другом. Значит,
1
они все (эти вероятности) равны , и поэтому вероятность победы
n
1 n?1
равна gn?1 =1? = (рис. 3).
n n
Теперь хорошо бы уже начать строить гипотезы относительно
того, чему равно gt в общем случае, но для этого пока ещё слишком
мало данных, поэтому сначала посчитаем gn?2 . Это уже сложнее,
чем в предыдущих двух случаях, но тут нам поможет один очень
полезный способ подсчёта такого рода вероятностей. Представим
себе следующую ситуацию. Иван Царевич стоит на перепутье, пе-
ред ним лежит камень, на котором написано: направо пойдёшь,
с вероятностью 0,5 утонешь, налево пойдёшь, с вероятностью 0,4
шею сломаешь, а прямо пойдёшь, с вероятностью 0,3 волки загры-
зут. Иван Царевич решает, что выберет себе дорогу, кинув монет-
ку: если выпадет орёл, то он пойдёт прямо, если решка, то он ещё
раз кинет монетку и при выпадении орла пойдёт налево, а при

n?1
1
gt
n

t n?3 n?2 n?1 n
Рис. 3
6
выпадении решки направо. Спрашивается, с какой вероятностью
Иван Царевич погибнет? Понятно, что вероятность пойти прямо
равна 0,5, пойти налево — 0,25, пойти направо — 0,25. Конечно,
сумма этих вероятностей равна единице. Погибнуть Иван Царевич
может в одном из трёх случаев, в соответствии с количеством на-
правлений. К примеру, вероятность того, что Иван Царевич выбе-
рет прямой маршрут и погибнет, равна 0,5·0,3 (важно понимать,
что 0,3 — это вероятность Ивана Царевича погибнуть, только если
он уже решил пойти прямо, так называемая условная вероятность;
но ещё не зная своего будущего выбора, он может посчитать ве-
роятность гибели, состоящую из трёх слагаемых, одно из которых
как раз 0,5·0,3). Таким образом, полная вероятность гибели Ивана
Царевича равна 0,5·0,3+0,25·0,4+0,25·0,5=0,375, т. е. нужно
умножить вероятность каждого случая на соответствующую услов-
ную вероятность, а потом результаты сложить. Эта формула в тео-
рии вероятностей называется формулой полной вероятности.
Вернёмся теперь к подсчёту gn?2 . Предположим, (n?2)-й пре-
тендент оказался самым лучшим среди всех предыдущих, и посчи-
таем, какова вероятность того, что он действительно лучше всех,
т. е. вероятность того, что ни n-й, ни (n?1)-й не являются самы-
ми лучшими. Заметим, что вероятность (n?1)-го оказаться лучше
1
(n?2)-го равна (действительно, рассуждая аналогично тому,
n?1
как мы рассуждали при подсчёте gn?1 , получаем, что эта вероят-
ность равна вероятности того, что (n?1)-й претендент окажется
именно на последнем месте в списке всех n?1 претендентов, упо-
рядоченных по возрастанию <качества>). Соответствующая вероят-
1
ность того, что (n?1)-й будет не лучше (n?2)-го, равна 1? =
n?1
n?2
= . Посчитаем условные вероятности победы. Если (n?1)-й
n?1
лучше (n?2)-го, то тогда (n?2)-й точно не самый лучший среди
всех n претендентов, т. е. вероятность победы в этом случае рав-
на 0. Если (n?1)-й хуже (n?2)-го, то тогда (n?2)-й является луч-
шим среди первых n?1 претендентов. А какая вероятность побе-
дить в этом случае? Иными словами, какова вероятность лучшего
среди первых n?1 остаться лучшим среди всех n? Но ведь мы эту
n?1
вероятность уже считали, она равна , т. е. в точности gn?1 .
n
Итак,
1 n?2 n?2 n?1 n?2
·0+ ·gn?1 = ·
gn?2 = = ,
n?1 n?1 n?1 n n

и мы можем заполнить нашу таблицу немного дальше (рис. 4).
7
n?2 n?1
1
gt
n n

t n?3 n?2 n?1 n
Рис. 4

Теперь уже у нас возникает подозрение насчёт общей форму-
лы для gt . И действительно, несложно доказать, пользуясь мето-
t
дом математической индукции, что gt = (обязательно проведите
n
доказательство!).
Вернёмся к ht . Вспомним, как определялась нами эта величи-
на. Именно, ht — это вероятность принцессы победить, т. е. по-
лучить в конце концов самого хорошего жениха, если она дойдёт
до шага t и пропустит претендента, который ей на этом шаге
встретится, а дальше будет действовать по оптимальной страте-
гии. Иными словами, это вероятность победить, оптимально дей-
ствуя начиная с шага t+1, а происходящее до этого ни принцессу,
ни нас вообще не волнует. Дальше мы посчитаем эту самую веро-
ятность ht , а сейчас просто заметим одно сразу бросающееся в гла-
за свойство этой функции. Из определения вероятности ht вытека-
ет, что какую бы стратегию, при которой принцесса может делать
свой выбор только начиная с шага t+1, мы не предложили, веро-
ятность успеха в случае действия принцессы в соответствии с этой
стратегией не превосходит ht . Предложим тогда такую: принцес-
са, вместо того чтобы сразу, с (t+1)-го шага, действовать опти-
мально, прогоняет (t+1)-го претендента и действует оптимально,
но уже начиная с (t+2)-го шага. Тогда, с одной стороны, вероят-
ность победы в случае выбора такой стратегии равна ht+1 , а с дру-
гой стороны, это же одна из стратегий для какого бы то ни было
действия начиная с шага t+1, отсюда сразу получаем неравенство
ht ?ht+1 для любого t. Этот факт можно переформулировать так:
чем раньше принцесса начнёт действовать по оптимальной страте-
гии, тем больше у неё шансов на победу. Значит, ht — монотонно
невозрастающая функция (правда, от целочисленного аргумента).
К примеру, hn =0, потому что если принцесса отвергает послед-
него претендента, то будь её последующая стратегия хоть трижды
оптимальной, всё равно принцесса уже не выиграет, так как боль-
ше никого из претендентов не осталось, однако h1 — вовсе даже
и не ноль, а какое-то вполне положительное число, предмет всего
нашего изучения, т. е. h1 >hn .
Посмотрим, что же у нас получилось. Изобразим графики
функций ht и gt , при этом будем рисовать их плавной линией, хо-
тя на самом деле они точечные, можете считать, что мы эти точки
просто соединяем. По одной оси отложим t — время, номер ша-
8
p p
1 1
gt gt

ht ht


nt nt
t1 T t1 T

Рис. 5 Рис. 6

га, а по другой p — шансы, вероятность, она принимает значения
от 0 до 1. При построении учтём уже полученные результаты —
линейность gt и монотонность ht . Тогда у нас получится пример-
но то, что изображено на рис. 5. Ясно, что построенные графи-
ки двух функций пересекутся. Обозначим абсциссу точки пересе-
чения за T (функции определены только в целых точках, но мы
их каким-то образом продлили на все числа, поэтому T не обязано
быть целым). Вспомним нашу стратегию, которую мы придумали
для принцессы: если на шаге t вероятность ht больше gt , то про-
должать независимо от претендента, если ht не превосходит gt , то
останавливаться в случае, когда текущий претендент лучше всех
предыдущих и продолжать в случае, когда он не является лучшим
среди всех предыдущих. Если t1 — это последнее целое число перед
T, то тогда стратегия, как видно из рис. 5, преображается в следу-
ющую: пропустить первые t1 человек, только посмотрев на них для
будущего сравнения с остальными, а дальше остановиться на пер-
вом же, который лучше всех своих предыдущих. Теперь можно
понять, какую ошибку, а вернее, неточность, мы допустили при
построении графика. Сравним, например, h1 и h2 . Скорее всего, t1
заведомо больше двух, а значит, и больше единицы. Поэтому на ша-
ге 1 и на шаге 2 стратегия одна и та же: нужно ждать до шага t1 ,
а сейчас претендента-королевича пропустить. Отсюда и вероятность

страница 1
(всего 4)

ОГЛАВЛЕНИЕ

След. стр. >>

Copyright © Design by: Sunlight webdesign