overmes May 1 2013 at 00:34

Дилемма заключенных: you are (not) alone

3 min

34K

Game development*Mathematics*

+23

Comments 18

nick4fake May 1 2013 at 00:50

— Если мы будем знать с какой вероятностью ОН предаст
А если таки не будем?

overmes May 1 2013 at 01:27

тогда наша модель будет плохо соответствовать действительности и вероятность ошибиться возрастает

qw1 May 1 2013 at 01:27

Почему-то никто не упомянул о такой замечательной модификации игры, как игра с фиксированным количеством раундов (например, рассмотрим N раундов).

Тогда, максимизируя свой выигрыш, мы обязаны на последнем N-ом раунде выставлять всегда «предательство», так как независимо от нашей предыдущей стратегии и стратегии противника это будет всегда выгоднее, чем «сотрудничество» (нет возможности «отомстить»). Предполагая, что противник умный и тоже заметил это обстоятельство, мы знаем, что на последнем раунде он тоже должен выставить «предательство» для максимизации своей выгоды. Значит, оптимальная стратегия шага N полностью определёна.

Определим стратегию шага N-1. Если на шаге N игроки выставляют предательство, то игра сводится в ведению N-1 шагов. По индукции определяем оптимальную стратегию — всегда выставлять «предательство»

зы. плюс поставил только за заголовок.

qw1 May 1 2013 at 01:33

Но почему же оказывается, что оптимальная стратегия хуже, чем «сотрудничество»?
Предательство даст нам -1 в худшем случае и +100 в лучшем.
Сотрудничество даст -100 в худшем и +1 в лучшем.
Но "+100 в лучшем" в реальности выглядит как тарифный план «до 100 мбит» у провайдера.
В реальности при использовании «предательства» мы получаем свои гарантированные -1, когда могли бы сойтись на +1.

При сотрудничестве разум действует как демон Максвелла, упорядочивая хаос и из вероятностей извлекая выгоду.

overmes May 1 2013 at 01:54

то есть после первого срока они снова попадаются вместе?

я рассчитал такой вариант — по максимаксу получается лучше молчать обоим, думаю по ожидаемому максимуму получится тоже самое
здесь я учитывал, что игроки на последующих шагах действуют помня как поступил соперник

как мне кажется задача значительно упращается

4c74356b41 May 1 2013 at 07:28

Эквилибриум неша — вариант А в ваше игре. тк у игроков нет данных о действиях противника они просто теоритезируют и простой расчет показывает что предательство всегда дает лучший результат чем сотрудничество.

overmes May 1 2013 at 10:44

если функции выигрышей полностью эгоистичные, тогда да, но если нет, то может выиграть и молчание

zTrue May 6 2013 at 11:59

deleted

Bobos May 1 2013 at 08:15

На мой взгляд тут явно не хватает функции «позелности» вокруг n и m. Ведь разница между результатом один год и два года гораздо меньше, чем разница между годом и оправданием. Именно поэтому зек скорее всего будет сотрудничать. А еще нужно как-то учесть, что у каждого из них эта функция будет своя.

overmes May 1 2013 at 10:41

можно просто сделать функцию не линейной

codecity May 1 2013 at 10:17

А что если нам не безразлична ЕГО судьба, а ему не безразлична НАША?

Другая сторона: братки просто так не оставят предателя.

dizer May 1 2013 at 10:25

> согласен с написанным и считаю, что это хорошая работа, особенно учитывая, что автор школьник.
Шикарная фраза, надо запомнить

overmes May 1 2013 at 10:40

убрал. я пытался похвалить, но получилось плохо

ddsl May 1 2013 at 13:18

Однако это не учитывает российские реалии, у нас лучше молчать в любом случае :)

overmes May 1 2013 at 13:40

пока в дело не вмешается паяльник. В формулах можно записать любые реалии.

giner May 13 2013 at 23:11

> Я считаю что дилемма заключенных это дилемма недостаточных входных данных. Если мы будем знать с какой вероятностью ОН предаст, как МЫ эгоистичны и как эгоистичен ОН, то сможем принять решение очень близкое к верному.
Именно так и есть. А входные данные это: личный опыт, религия, культура, воспитание и т.д.

Michael134096 Aug 19 2013 at 19:35

дилемма заключенного вики:
ru.wikipedia.org/wiki/%D0%94%D0%B8%D0%BB%D0%B5%D0%BC%D0%BC%D0%B0_%D0%B7%D0%B0%D0%BA%D0%BB%D1%8E%D1%87%D1%91%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE
Хотя стратегия «око за око» считалась самой удачной простой стратегией, команда Университета Саутгемптона из Англии (под руководством профессора Николаса Дженнингса[6]) представила новую стратегию на 20-ю годовщину Чемпионата по ПДЗ. Эта стратегия оказалась более успешной, чем «око за око». Она основывалась на взаимодействии между программами, чтобы получить максимальный счёт для одной из них. Университет выставил на чемпионат 60 программ, которые РАСПОЗНАВАЛИ ДРУГ ДРУГА ПО РЯДУ ДЕЙСТВИЙ (КАК???) на первых 5-10 ходах. УЗНАВ ДРУГУЮ (КАК???), одна программа всегда сотрудничала, а другая предавала, что давало максимум очков предателю. Если программа понимала, что оппонент — не саутгемптонский, она дальше всё время предавала его, чтобы минимизировать результат соперника. В результате[7] эта стратегия заняла первые три места в соревновании, как и несколько мест подряд ниже.

ждем ответов на вопросы.

overmes Aug 19 2013 at 20:53

математически, вроде, не сложно узнать:
создаем гипотезу
проводим тесты
смотрим на результат
берем верную гипотезу

Show the best of all time