Возможно, вы знаете задачу о пяти пиратах.

Пять хитрых рационально мыслящих пиратов (A, B, C, D, E) нашли клад в 100 золотых монет. Согласно древнему морскому закону, старший пират (A) должен предложить план распределения, за который голосуют все пираты, включая самого предлагающего. Если план принимается не менее чем половиной голосов, монеты делятся согласно плану. В противном случае предложившего приносят в жертву морским богам, и распределение предлагает следующий по старшинству.

Все пираты абсолютно рациональны и принимают решения, исходя из четырёх приоритетов:

1. Выжить.

2. Получить максимальную долю монет.

3. При прочих равных — предпочесть, чтобы кого-нибудь принесли в жертву.

4. Пираты не доверяют друг другу и не способны придерживаться каких-либо договорённостей, за исключением предлагаемого плана распределения.

Но в этот раз всё пошло не так

Клад содержал не только монеты, но и эликсир правды. Его на радостях отдали младшему пирату (E) — считая его безобидным идеалистом. Впрочем, может, они были правы — он и был идеалистом. Просто не безобидным.

Эликсир даёт выпившему уникальную способность: давать нерушимые клятвы в любой момент. Клятва, данная таким образом, физически не может быть нарушена, и все пираты это знают. E может клясться о том, как он будет голосовать и при каких условиях. 

Младший пират давно считал древний морской закон отвратительным: система, в которой один забирает почти всё, а остальные голосуют за это из страха — не справедливость, а узаконенный грабёж. Его цели отличаются от остальных:

1. В первую очередь — чтобы выжило как можно больше пиратов.

2. Во вторую — забрать себе как можно больше монет (не из жадности, а чтобы потом разделить их так, как он считает справедливым).

E рационален в рамках своих приоритетов и готов использовать любые стратегии для достижения целей.

Какие клятвы давал E и к чему это привело в итоге?

Решение

Решение строится индукцией снизу вверх: от простейшего случая к полному.

Два пирата (D и E)

D предлагает план и голосует за него. Один голос из двух — это ровно половина. План принимается. D забирает все 100 монет. E ничего не может сделать.

Итог: D = 100, E = 0.

Три пирата (C, D и E)

C предлагает план. Ему нужны 2 голоса из 3.

D голосует против C при любом раскладе. Почему? Если C погибнет, D получит все 100 монет (как показано выше), и вдобавок кто-то будет принесён в жертву — что удовлетворяет приоритет 3. Никакое предложение C не может быть лучше, чем 100 монет плюс жертва, потому что D предпочтёт то же самое плюс гибель C.

Значит, C полностью зависит от голоса E.

E это понимает и пользуется ситуацией. Он даёт нерушимую клятву: —

«Я проголосую за план C тогда и только тогда, когда C предложит то распределение, которое я назову».

C вынужден подчиниться: альтернатива — смерть. E может диктовать любое распределение при трёх пиратах.

Четыре пирата (B, C, D и E)

A уже принесён в жертву, B предлагает план. Ему нужны 2 голоса из 4.

Если B предлагает то, что требует E — E голосует за. Вместе с голосом B это 2 из 4, план принят.

Если B предлагает что-то другое — E даёт следующую клятву:

«Если B будет принесён в жертву, то при трёх пиратах я потребую распределение, в котором C и D получат ровно столько, сколько предлагал B в своём отвергнутом плане».

Что это значит для C и D? Они понимают, что в случае 3 пиратов, E может продавить любые требования и они получат такое же количество монет в обоих случаях — но если B погибнет, это удовлетворяет их приоритет 3 (предпочтение жертвы при прочих равных). Значит, C и D рационально голосуют против B.

У B нет выхода. Любой план, не одобренный E, будет отклонён. B не может перекупить C или D, потому что клятва E гарантирует им ту же сумму плюс жертву.

E может диктовать любое распределение при четырёх пиратах.

Пять пиратов (A, B, C, D и E)

Полный состав. A предлагает план. Ему нужны 3 голоса из 5.

Если A предлагает не тот план, который требует E. E даёт клятву:

«Если A будет принесён в жертву, то при четырёх пиратах я потребую распределение, в котором B, C и D получат ровно столько, сколько предлагал A».

Та же логика: B, C и D получат те же монеты, но A погибнет — приоритет 3 делает жертву предпочтительной. Все трое голосуют против A.

Если A предлагает план E. Теперь A нужны ещё 2 голоса. E голосует за — это уже 2. Нужен третий. Поэтому E требует, чтобы B голосовал за этот план и клянётся:

«Если план A будет отклонён, я не приму ни один план B».

но, как доказано выше, E способен обеспечить отклонение любого плана B. Это означает, что B будет принесён в жертву — никакой его план не пройдёт. У B нет альтернативы: он голосует за план A, чтобы выжить.

Итого: A, B, E - 3 голоса из 5. План принят.

E может диктовать любое распределение при пяти пиратах.

* * *

E, самый младший и бесправный пират, получает абсолютный контроль над распределением. Все пять пиратов остаются в живых. E назначает любое распределение, какое считает справедливым.

Обе цели E выполнены: максимум выживших (все пятеро) и максимум контроля над монетами.


Есть что-то завораживающе мерзкое в этой задаче. Принято считать, что в мире рациональных эгоистов побеждает тот, кто хитрее и бессовестнее. Но здесь всё наоборот: систему, построенную на страхе и жадности, ломает единственный участник, который не может лгать. Самый бесправный пират получает абсолютную власть — не потому что он хитрее остальных, а потому что его слово нерушимо. Эликсир правды — предмет, созданный для доверия — становится инструментом абсолютного контроля.

А что, собственно, плохого? Все живы. Монеты поделены справедливо. Но неприятный привкус остаётся — потому что методы E ничем не отличаются от методов системы, которую он сломал: шантаж, угрозы, безвыходность. Просто раньше они работали на старшего, а теперь на то, как E видит справедливость. Если бы E был добреньким, он бы проиграл. Система не оставляет добру шанса не запачкать руки — и это, может быть, самое мерзкое.

Так кто на самом деле тролль: тот, кто пользуется законом, позволяющим одному забрать 98 монет из 100, — или тот, кто этот закон сломал?

* * *

Идея модификации задачи и её решение принадлежит автору. ИИ использовался только для стилистической редактуры. 

UPD:

Считаем, что E мог дать все клятвы перед голосованием, чтобы убедить остальных пиратов, тем самым убрав неопределенность из задачи. (В противном случае, откуда бы остальные пираты бы знали, что E сможет сделать, если голосование пойдёт не по его плану).

Комментарии (34)


  1. ksbes
    22.06.2026 13:06

    Идея модификации задачи и её решение принадлежит автору.

    Да-да, а мы, комментаторы Хабра, ну просто вообще не при чём )))


  1. kipar
    22.06.2026 13:06

    Круто, только эти “предлагает то решение которое считает нужным” слегка вводят в заблуждение. Исходя из своих целей Е будет требовать (и получит) все 100 монет себе.


    1. ksbes
      22.06.2026 13:06

      Для него сохранение жизни пиратов более высокий приоритет, чем получить все деньги. А если он при 5 пиратах потребует 0 монет всем остальным, то 3м как минимум будет выгодно “убить” А, прежде чем принять это предложение (их приоритет №3) на следующем круге. Что категорически не устроит Е (его приоритет №1 - выживание А). Так что решение как-то … неокончено.


      1. BrainDebugger Автор
        22.06.2026 13:06

        Это действительно нетривиальный момент.

        В живых 5 пиратов. Согласно требованию пирата E, пират A предлагает, чтобы E получил 100 монет остальные 0. За пираты A,E. Нужен ещё один голос.

        Но E заявил, что B должен проголосовать ЗА иначе E будет против любого его предложения.

        Фишка тут в том, что пират E готов "убить" B, понимая что именно эта готовность позволит манипулировать остальными пиратами так, чтобы никто не погиб и монеты были распределены правильно (с точки зрения E)


        1. ksbes
          22.06.2026 13:06

          Если E так сделает - он нарушит условия индукции. А значит С и/или D тоже “имеют право нарушить индукцию” и заверить B в своей поддержке - за соответсвующую плату в 100 монет ) (ну или в 1 монету - сговариваться же нельзя!)


          1. BrainDebugger Автор
            22.06.2026 13:06

            Изначально в задаче было правило

            4. Пираты не доверяют друг другу и не способны придерживаться каких-либо договорённостей, за исключением предлагаемого плана распределения.

            За исключением E, который находится под действием эликсира. Именно поэтому он может так делать.


            1. ksbes
              22.06.2026 13:06

              Но ещё раз - при таком поведении Е нарушаются условия индукции. Т.е. все предыдущие рассуждения выбрасываются за борт. И задачу для 5 пиратов надо решать “с нуля” не опираясь на решения задачи с меньшим числом пиратов. Это просто логически некорректно.

              Ну или Е должен давать тоже обещание В, какое бы он давал при 4х пиратах. Т.е. на каждом шаге индукции мы “зафиксировали обещание”. И при увеличении числа пиратов - он должен дать всем “старым” пиратам точь в точь те же самые обещания что были на предыдущем шаге. Иначе просто принцип индукции ломается и рассыпается на независимые задачи.


              1. kipar
                22.06.2026 13:06

                Индукция тут и не работает, задачу в посте для 5 пиратов пришлось решить с нуля (добавить еще одно обещание т.к. иначе голосов для принятия не хватало). Что будет для большего числа пиратов мне не совсем понятно - вроде бы пираты смогут проигнорировать Е и спокойно поделить добычу по старинке.


                1. BrainDebugger Автор
                  22.06.2026 13:06

                  При большем количестве пиратов я не смог найти решение, при котором E может забрать все монеты, и вероятно его не существует. Задумка в том, что на каждом этапе хотя бы половина пиратов должна получать хотя бы одну монету, чтобы было что терять. А если старший пообещает что-то не то, то ему эти монеты не переобещаются (чтобы было чем подкупить остальных.

                  В общем, решение, вероятно, возможно, но более громоздкое.


                  1. Alexandroppolus
                    22.06.2026 13:06

                    При большем количестве пиратов я не смог найти решение, при котором E может забрать все монеты, и вероятно его не существует

                    Кажется, при 6 пиратах работает та же схема, как при 5: эликсирщик может аналогично навязать старшему свой план под угрозой смерти, а второму пообещать "неподдержку", если старший помрет. И вроде бы это обобщается и дальше, только при 7 и 8 игроках надо обещать неподдержку второму и третьему, и т.д.

                    На всякий случай, он может заранее рассказать остальным свою стратегию, и дать клятву, что будет её придерживаться.


                    1. kipar
                      22.06.2026 13:06

                      Как заметили ниже, одно мешает другому. Если он обещает неподдержать любой план, но при этом обещает скопировать этот неподдержанный план (а только так он может гарантировать его провал на голосовании), то имеет все шансы проиграть уже на 5 пиратах.


  1. axion-1
    22.06.2026 13:06

    «Я проголосую за план C тогда и только тогда, когда C предложит то распределение, которое я назову».

    А почему Е называет распределение не в свой ход? По изначальным правилам он должен только голосовать за или против предложенного старшими. Если у него есть такое право, то он и без эликсиров уже в привилегированном положении по сравнению с другими.


    1. BrainDebugger Автор
      22.06.2026 13:06

      Согласен. Я это подразумевал, но явно не указал, что E должен дать все клятвы заранее, чтобы точно убедить других пиратов. Добавлю в статью.

      Но без эликсира, если бы он предлагал такое, это бы никак не повлияло на голосование, потому что никто никому не верит.


  1. nickolaym
    22.06.2026 13:06

    Нужен ли вообще элексир правды?

    Главное отличие этой версии задачи - в том, что у 4 пиратов целевая функция одинакова (жизнь, бабло, кровожадность), а у пятого - другая (жизнь, бабло, милосердие). Причём его жизни ничего не угрожает, а порядок (бабло, милосердие) или (милосердие, бабло), похоже, не играет роли.

    Если все пираты насквозь прозорливые, то они безо всяких клятв вычислят оптимальную линию поведения пятого, так же, как они вычисляют линии поведения подельников.

    Попробую промоделировать индукцию в этих условиях.

    0) E остался один, распеределение - всё бабло к нему.

    1) D, E. Голос D решающий, скатиться к 0 в принципе невозможно, убивать некого. D максимизирует цф, получая (1,100,3), а E достаётся (1,0,2).

    2) C, D, E.

    Что бы ни предложил C, - D при отказе получит больше (на +1 жертву, как минимум).
    E выбирает между (1, 100-Mc-Md, 3) и (1, 0, 2).

    Клятва в этот момент означает, что пираты уже знают, как устроены решения E.

    И вот тут внезапно! Если C предложит ему (1,0,3) - то есть, "я тебе ничего не дам, но ты же заинтересован, чтобы выжило как можно больше? это лучше, чем если вы меня убьёте!"

    Может ли E поклясться "если C предложит мне 0, то я его убью!"? Нет, это противоречит его целевой функции.

    Тут как бы возникает коллизия. C видит, к чему идёт дело, и, прежде чем E поклянётся "если C не отдаст мне все 100, то я его убью", - сам может сказать "если E меня убьёт, то хрен ему чего достанется". Безо всякой клятвы. Типа, E, ублюдок, мать твою, ты думал меня трахнуть, иди, я сам тебя трахну, дерьмо собачье!


    1. kipar
      22.06.2026 13:06

      Поэтому поведение с клятвами все-таки отличается от поведения без клятв. С клятвами Е нельзя подкупить какими-то предложениями, т.к. независимо от сказанных слов Е все равно проголосует против если его доля будет меньше 100. А С не настолько хочет обставить Е чтобы заплатить за это жизнью.


    1. nickolaym
      22.06.2026 13:06

      Но кстати, давайте посмотрим, если E не клянётся всякой фигнёй, а действует рационально.

      Итак, случай 2) C,D,E. Как мы выяснили, для E (1,0,3) лучше, чем (1,0,2), поэтому C предлагает распределение 100-0-0 (всё себе, D будет протестовать, а этот сопляк E добренький).

      3) B,C,D,E.

      Если B убьют, то E получит (1,0,3). Если оставят в живых, то (1,e,4). Ровно та же фигня получается! То есть, E голосует "за". B+E дают кворум. Поэтому B предлагает распределение 100-0-0-0.

      4) A,B,C,D,E.

      Если A убьют, то B получит (1,100,1), C - (1,0,1), D - (1,0,1), E - (1,0,4).
      Если A оставят, то B получит (1,b,0), C - (1,c,0), D - (1,d,0), E - (1,e,5).

      Видно, что B заинтересован голосовать против, E опять заинтересован голосовать за, так что нужно просто ублажить C или D хотя бы одной монеткой.

      99-0-1-0-0 или 99-0-0-1-0.

      А всё потому, что сопляк добренький!


    1. nickolaym
      22.06.2026 13:06

      Допустим, E не кровожадный, а пофигистичный.

      И да, я зря стал писать тройки, - понятно, что там 1 в начале всегда. Итак, двойки (бабло, жертвы). Для E - (бабло, 0).

      D,E.
      Если D выжил, то (d,3) и (e,0), где d+e=100.
      D, разумеется, выжил, поэтому 100 и 0.

      C,D,E.
      Если C выжил, то (c,2), (d,2), (e,0).
      Если C убили, то (0,0), (100,3), (0,0).
      D заинтересован убить. E готов принять хотя бы монетку, поэтому 99, 0, 1.

      B,C,D,E.
      Если выжил, то (b,1), (c,1), (d,1), (e,0).
      Если убили, то (0,0), (99,2), (0,2), (1,0).
      C можно перекупить только 100 монетами, d - одной, e - одной (или, для надёжности, двумя).
      Ясное дело, что выгоднее 99-0-1-0.

      A,B,C,D,E.
      Если выжил, то (a,0), (b,0), (c,0), (d,0), (e,0).
      Если убили, то (0,0), (99,1), (0,1), (1,1), (0,0).
      B можно перекупить только 100, C - 1, D - 2, E - 1.
      Нужно купить два голоса, это будут C и E. 98-0-1-0-1.


    1. nickolaym
      22.06.2026 13:06

      Наконец, пусть E радикальный. Его позиция: "если я не получаю максимум, то лучше я убью всех, пусть поплачут".

      D,E - как мы знаем, (100,3), (0,3).

      C,D,E
      Если выжил - (c,2), (d,2), (e,2). Если нет - (0,0), (100,3), (0,3).
      И вот тут E может сказать: либо я получу 100, либо C умрёт.
      Тогда (0,2), (0,2), (100,2).

      B,C,D,E.
      Если выжил - (b,1), (c,1), (d,1), (e,1). Если нет - и если индукция работает! - то (0,0), (0,2), (0,2), (100,2).
      B нужно купить один голос. И казалось бы, достаточно дать монету c или d.

      Но. Индукция здесь так не работает. E действительно может анонсировать, что на следующем шаге он примет такое решение, которое будет максимизировать его выгоду на этом шаге.

      Но, раз пираты все продуманные, - что мешает пиратам C и D устроить тот же цирк? У них нет элексира, но у них есть свобода слова и воли.

      Ну ок, свободу слова у них отняли процедурой, - голосуют молча. Но они же могут мысленный пинг-понг устроить... Может быть, тут надо посмотреть в сторону равновесий Нэша?


      1. kipar
        22.06.2026 13:06

        D устраивает ровно тот же цирк (всегда голосует против, ведь если все прошлые провалятся то деньги его). Е может конкурировать с ним только за счет клятв. А старшие пираты не могут действовать также т.к. они рискуют умереть.


        1. nickolaym
          22.06.2026 13:06

          D это не устраивает, потому что во всех случаях, кроме провала троих, - денег ему не достанется вовсе.


          1. ksbes
            22.06.2026 13:06

            Но он может наслаждаться казнями! Это ему тоже в плюс. А вот для Е - любая казнь неприммлема (он лучше все деньги потеряет). Потому , если было бы возможно обсуждение - “оригинальнм” Е бы этим задавили и оставили бы ни с чем.

            Т.е. подкуп одной монеткой с “кровожадными” пиратами не сработает - т.к. для них одна монетка + казнь лучше одной монетки. И потому у А очень мало вариантов выжить, если вообще есть при пофигистичном Е (для того же С 100 монет+ казнь - лучше 100 монет!)


          1. kipar
            22.06.2026 13:06

            Я имею в виду что если убрать механизм клятв, то D находится в положении не хуже Е (и даже лучше), т.к. тоже не рискует умереть. А вот начиная с C угрозы E начинают работать.


  1. Alexandroppolus
    22.06.2026 13:06

    Идея модификации задачи ... принадлежит автору

    Исходная задача недавно обсуждалась, в комментах я озвучил ту же идею. Но на первенство не претендую, наверняка эта мысль возникала у многих в разное время. Собственно, решение исходной задачи опирается как раз на отсутствие такого эликсира.

    Но здесь всё наоборот: систему, построенную на страхе и жадности, ломает единственный участник, который не может лгать.

    Тут дело не во лжи/правде, а в том, что обладатель эликсира реально умеет в пресловутые "красные линии" и за счет этого имбует.


  1. Wizard_of_light
    22.06.2026 13:06

    Без эликсира правды при числе пиратов N>2 команда итеративно сократится до двух человек а потом ночью до одного. Рациональные пираты подчиняются нерациональному закону, поэтому всё так.


  1. axion-1
    22.06.2026 13:06

    E может диктовать любое распределение при четырёх пиратах.

    Вот только не любое, он будет обязан отдать B, C, D то количество монет которое пообещал им А на предыдущем этапе.

    То же самое для случая с тремя пиратами.


    1. axion-1
      22.06.2026 13:06

      Даже более того, если А принесли в жертву, B будет знать что ни один его план не будет принят Е. У него нет смысла соглашаться с планом Е, он может предложить любое другое распределение только ради того чтобы поломать схему.


      1. kipar
        22.06.2026 13:06

        эти клятвы рассчитаны так что исполнять их не придется) А сам отдаст Е 100 монет своим планом, т.к. не умереть ему важнее чем монеты, а B поддержит его т.к. тоже хочет жить.


        1. ksbes
          22.06.2026 13:06

          Ну так рассуждая - все единогласно (ну кроме D) проголосуют за Е при любом числе пиратов. Т.к. обещание “я тебя убью, если не отдашь мне все деньги” можно повторять для всех! Но только D - может его безопасно проигнорировать.


          1. kipar
            22.06.2026 13:06

            Да, но он же не соло убивает - ему нужен

            1. план как убить при отказе, т.е. добиться чтобы против плана проголосовало больше половины

            2. план как оставить в живых при согласии, добиться чтобы за план проголосовало больше половины.


          1. Wizard_of_light
            22.06.2026 13:06

            Там от допустимого уровня риска будет зависеть. В модели "любой куш дороже жизни" А, В и С принесут в жертву, D загребёт все деньги. В модели "жизнь дороже любых денег" A, В и D останутся без денег, Е получит одну монету, С получит 99. В модели "без денег это не жизнь" А принесут в жертву, В получит 50 монет, Е 50, C и D останутся без денег.


            1. Wizard_of_light
              22.06.2026 13:06

              Блин, не, ошибся, в модели "без денег это не жизнь" "А" возьмёт себе 96, даст монету C и три монеты Е, и выживет. Потому что иначе если его утопят, С останется без денег, а Е получит меньше.

              UPD, и опять ошибся, можно подкупить D всего одной монетой и С одной монетой, так что А может заграбастать 98)


        1. axion-1
          22.06.2026 13:06

          Не факт. Тут проблема в том что вся схема ломается. К примеру, Е требует себе все монеты. А предлагает С 80 монет, а себе оставляет 20. А и B голосуют за, D и E против. Как будет рассуждать C?

          Если я проголосую против, А будет принесён в жертву и на следующем ходе E будет голосовать против B, т.к. связан клятвой отвергать любой его план. Соответственно, B сможет предложить любое распределение которое взбредёт ему в голову, и Е будет обязан поддержать его на следующем этапе.

          С большой вероятностью B предложит С в этом случае меньше 80 монет, поэтому смысла отвергать план А нет.


          1. ksbes
            22.06.2026 13:06

            Смысл есть. Не забывайте - пираты кровожадны. Т.е. и С - в любом случае не получая ничего вполне удовлетворится смертью А и В. Для него это положительный балланс. Кровожадность это тот ещё геймченжер. Е - это единственная надежда А не выживание!


            1. axion-1
              22.06.2026 13:06

              Кровожадность по приоритету меньше жадности. Если А изначально предложит С 80 монет, С будет выбирать между гарантированными 80 монетами, или неизвестным количеством который предложит B на следующем шаге.

              Ключевой момент - в случае 4-х пиратов, B не обязан соглашаться с планом Е! Для него не будет разницы соглашаться или нет, Е в любом случае отвергнет его план.