В теории вероятностей имеется несколько известных задач, решение которых противоречит здравому смыслу. Одна из таких задач — «Парадокс сестёр». Сейчас я изложу условие задачи, дам вам возможность подумать над ответом, а потом расскажу о том, как её решать.

Итак: в семье есть два ребёнка. Известно, что по крайней мере один из них — девочка. Какова вероятность того, что оба ребёнка — девочки?

Предположим, что вероятность рождения мальчика или девочки — 50%, и что порядок рождения детей на эту вероятность не влияет. Ещё учтём то, что семьи выбраны случайным образом из тех семей, в которых есть хотя бы одна девочка.

Как думаете — какова вероятность того, что оба ребёнка в семье окажутся девочками?

Упрощённая задача

Представим, что вам задали вопрос попроще.

В семье два ребёнка. Какова вероятность того, что оба — девочки?

Решить эту задачу можно, прибегнув к простому дереву вероятностей:

           Мальчик (0.5)                                 Девочка (0.5)
  
       /                   \                          /                   \

Мальчик-Мальчик (0,25)  Мальчик-Девочка (0,25)  Девочка-Мальчик (0,25)  Девочка-Девочка (0,25)

Получается, что вероятность того, что в семье две девочки — 0,25.

Обратите внимание на то, что тут имеется два варианта наличия в семье мальчика и девочки. В результате общая вероятность того, что в семье есть мальчик и девочка (в любом порядке), равняется 0,5.

Неправильный ответ

Вернёмся к исходной задаче и разберёмся с тем ходом мыслей, который приводит к появлению неправильного ответа, встречающегося чаще всего.

По условию задачи вероятность рождения и для мальчика, и для девочки составляет 0,5. Мы не знаем пол второго ребёнка, но это, с вероятностью 0,5 — девочка. Учитывая, что нам уже известно о том, что один из детей — девочка, вероятность того, что в семье будет две девочки, должна составлять 0,5.

Этот ответ кажется правильным, так как звучит он вполне логично, но, на самом деле, такой ответ неверен. Ниже я расскажу о том, почему это так.

Правильный ответ

Правильный ответ — 1/3.

В вышеприведённом дереве вероятностей можно видеть четыре равновероятных комбинации детей: {Мальчик-Мальчик} (0,25), {Мальчик-Девочка} (0,25), {Девочка-Мальчик} (0,25), {Девочка-Девочка} (0,25). Комбинация {Мальчик-Мальчик}, по условию задачи, исключается, поэтому дальше мы работаем с тремя оставшимися комбинациями. Каждая из них может появиться с одной и той же вероятностью, при этом, какой бы ни была эта комбинация, она обязательно будет одной из трёх оставшихся. Всё это значит, что вероятность того, что в семье имеется две девочки, оставляет 1/3.

Существует две комбинации, соответствующие наличию в семье разнополых детей: {Мальчик-Девочка} и {Девочка-Мальчик}. Это значит, что вероятность того, что в семье будут мальчик и девочка (в любом порядке), составляет 2/3. Ошибочно считать эту вероятность равной 0,5.

Пространство выборки

В основе подхода к решению этой задачи лежит концепция, называемая «пространством выборки». Это — набор всех возможных исходов эксперимента. В нашем случае набор всех исходов эксперимента — это {{Мальчик-Девочка}, {Девочка-Мальчик}, {Девочка-Девочка}}. Каждому элементу нашего пространства выборки можно назначить вероятность. В нашем случае вероятность каждого из них составляет 1/3.

Концепция пространства выборки помогает в решении различных вариантов исходной задачи. Вот пример. Если нам сообщили, что старший ребёнок в семье — девочка — изменит ли это ситуацию? На самом деле — изменит. Пространство выборки будет выглядеть как {{Мальчик-Девочка}, {Девочка-Девочка}} (старший ребёнок находится в конце списка). Теперь вероятность появления каждого из вариантов — 1/2. Почему? А потому что комбинация {Девочка-Мальчик} при такой постановке задачи появиться не может.

Как это проверить?

Решая задачи, подобные этой, правильные ответы на которые, на интуитивном уровне, кажутся нелогичными, полезно проверять теоретические рассуждения на практике. Понятно, что опрос реальных семей — это дорогое удовольствие, но тут можно прибегнуть к компьютерному моделированию. Вот как это сделать:

  1. Случайным образом генерируем множество семей с двумя детьми, используя пространство выборки {Мальчик-Мальчик}, {Мальчик-Девочка}, {Девочка-Мальчик}, {Девочка-Девочка} и вероятности 1/4, 1/4, 1/4 и 1/4.

  2. Выбираем только те семьи, в которых имеется как минимум одна девочка.

  3. Выясняем долю семей, в которых имеется комбинация детей {Девочка-Девочка}.

Интересно отметить, что размышления о том, как протестировать некое решение, часто помогают немного лучше понять задачу. Я, например, обнаружил, что простое перечисление последовательности действий по проверке решения помогло мне подтвердить правильность полученного ответа.

Споры, сложность и смысл

Здесь я привёл простой анализ не слишком сложной задачи, но учтите, что вы можете столкнуться с гораздо более сложными задачами. Статья из Википедии о «Парадоксе мальчика и девочки» содержит глубокие рассуждения об этой задаче и о спорах, которые она вызывает. Если не вдаваться в детали, можно сказать, что в поиске правильного ответа огромную роль играет точная и подробная формулировка задачи.

Возможно, это к делу не относится, но я видел, как в реальных условиях, в бизнес-среде, возникают разные варианты этой задачи. В результате у меня бывали неприятные разговоры с людьми, не обладающими специальными знаниями и пытающимися такие задачи решать. Особенно тяжело обсуждать подобные вещи в тех случаях, когда ошибочное решение, продиктованное «здравым смыслом», выглядело оптимистичнее, чем настоящий правильный ответ. По правде говоря, единственный выход здесь — заранее обучать людей всему необходимому и рассуждать, опираясь на концепцию пространства выборки.

Когда при решении различных задач применяют теорию вероятностей и, в частности, понятие условной вероятности, могут получаться результаты, совершенно противоречащие здравому смыслу. Если вы с чем-то таким сталкиваетесь — советую поступать так:

  • Максимально точно формулируйте исходные допущения при описании задачи.

  • Найдите способ проверки своей теории с помощью компьютерного моделирования. Найдя его — вернитесь к формулировке задачи и проверьте её.

  • Не полагайтесь на «здравый смысл».

О, а приходите к нам работать? ? ?

Мы в wunderfund.io занимаемся высокочастотной алготорговлей с 2014 года. Высокочастотная торговля — это непрерывное соревнование лучших программистов и математиков всего мира. Присоединившись к нам, вы станете частью этой увлекательной схватки.

Мы предлагаем интересные и сложные задачи по анализу данных и low latency разработке для увлеченных исследователей и программистов. Гибкий график и никакой бюрократии, решения быстро принимаются и воплощаются в жизнь.

Сейчас мы ищем плюсовиков, питонистов, дата-инженеров и мл-рисерчеров.

Присоединяйтесь к нашей команде

Комментарии (7)


  1. ChePeter
    02.09.2025 09:39

    очередной пример того как не надо делать!

    1. Вот все родились и вы просто не знаете, какие дети там, где вам интересно. Ну так тут и нет никакой теории вероятностей, так как нет никакой случайности. Тут можно применить теорию множеств и считать мощности и пропорции. Но по сути нет случайности и нет вероятности. Применение теорвера приведет к ерунде. Можете сами убедится.

    2. Допустим у вас уже есть ребенок девочка и вы решили завести еще ребенка. И какая вероятность, что у вас будут две девочки? Вот тут случайность есть и есть у нее вероятность и нет никаких парадоксов.


  1. ALapinskas
    02.09.2025 09:39

    Как это проверить?

    Гораздо проще проверить на монетке. По сути, так же задача: если выпал орел, какова вероятность выпадения орла следующим подбросом.


    1. unreal_undead2
      02.09.2025 09:39

      Это соответствует варианту "мы знаем, что старший ребёнок девочка". Эквивалент оригинальной задачи - монетку подбрасывали два раза, и мы знаем что как минимум один раз (не факт, что при первом подбросе) выпадал орёл. Соответственно, вероятности второго орла/девочки в разных вариантах разные.


  1. kms-111402
    02.09.2025 09:39

    Дерево вариантов конечно даёт 1/3, тут все понятно. Но ! В задаче не сказано , что эти дети не однояйцевые близнецы. А раз так , то эту возможность также надо учитывать, так как при таком условии второй ребенок будет девочкой уже без вариантов. С учетом этого ответ будет больше чем 1/3.

    Более того , дети могут быть дизиготными близнецами , то есть разнояйцевыми. Тогда вероятность второй девочки 1/2. Это тоже следует учитывать и это ещё немного увеличит ответ.


  1. vityo
    02.09.2025 09:39

    Бред, надо понимать где по условию заканчивается, а где начинается вероятность. От момента выбора семьи без детей, или от момента выбора семьи с девочкой. Туда же про дебильный парадокс монти холла, надо понимать где заканчивается эксперимент, а где начинается новый. От этого зависит ответ. А то там тоже хитро заканчивают одну задачу и начинают новую.

    Это как в задачах с поиском пи без окружности - она лишь хорошо спрятана. Здесь также, спрятано понимание границ начала эксперимента.

    Короче, вот именно что надо нормально без ухищрений описывать задачу, как и сказано в выводе


    1. bBars
      02.09.2025 09:39

      Вот я с друганами, которые гораздо сильнее меня в математике и тервере, так же про Монти-Холла спорил. Мне тоже казалось, что там речь идёт о двух слабо связанных задачах (как вы выразились), но я не мог тогда это внятно донести. И вот читая эту статью, я сразу же определил правильный ответ (по мнению её автора), как раз памятуя о том споре. Из спора того я вынес следующие: это не две разных задачи, а два выражения, и вот их-то и нужно решать именно таким образом — системно.

      Эта задача про сестёр — гораздо более наглядный пример того же, что показывает Монти-Холл, как по мне. Разумеется, если оставить в стороне биологию и проч.


  1. konst90
    02.09.2025 09:39

    Ещё один корпоративный блогер добрался до занимательных задач. На моей памяти это уже четвертый.