Классический Legal Judgment Prediction почти всегда обучается на готовых "юридических фактах" - тех самых установленных судом обстоятельствах, которые попадают в мотивировочную часть решения. Но для юриста или бизнеса важен прогноз до того, как суд все это отфильтровал: на руках есть только набор взаимно противоречивых документов, а не аккуратный список фактов.

В свежем препринте предложили формализовать недостающее звено для "AI‑судей" - предсказывать факты (Legal Fact Prediction) и датасет LFPBench, который имитирует реальный сценарий "есть только доказательства, решения еще нет". Эту архитектуру - сначала восстанавливаем факты, потом применяем право - постепенно внедряю в "неШемяку!", почему бы об этом не рассказать...

Авторы исследования "Legal Fact Prediction: The Missing Piece in Legal Judgment Prediction" (EMNLP 2025) наглядно показали, что если просто скормить модели "сырые" доказательства и попросить предсказать исход, качество резко проседает относительно идеализированного сценария "когда у нас уже есть факты из решения". Это делает большинство академических LJP‑результатов с высокими цифрами на "чистых фактах" слабо применимыми в продакшене.

Исследователи предлагают добавить недостающее звено - слой Legal Fact Prediction (LFP). Процесс становится двухшаговым: сначала AI по сырым документам восстанавливает, какие факты с высокой вероятностью будут признаны судом установленными, а уже потом применяет к ним нормы права и прогнозирует исход. Такой подход позволяет значительно сократить просадку по качеству по сравнению с прямой схемой "документы → сразу решение".

Один из показательных результатов: специализированные "юридические" модели на базе Llama уступили топовым general‑LLM вроде GPT и Claude. Для восстановления фактов критична не столько "начитанная юрбаза", сколько способность к сложному reasoning - понять, кто что сделал, где противоречия и как выстраивается цепочка событий.

Отсюда и практический вывод для LegalTech. Эффективнее строить системы, которые сначала помогают собрать нарратив "как это, скорее всего, увидит суд", а уже затем оценивают шансы и подбирают правовые аргументы.

Само исследование

Всем хороших выходных!

Комментарии (2)


  1. 478wo55bn4p987
    05.12.2025 19:48

    Пропадет романтика судебная. Сейчас адвокаты усердно гадают на кофейной гуще и пытаются торговаться до суда. И если сделка удалась, то каждый думает, что именно он в плюсе.

    Одна радость что возможно цены на адвокатов упадут, теперь то исход будет понятен сразу и есть смысл быстрее идти на сделку. Хотя может и наоборот цены взлетят, мол мы посмотрели дело то ваше проигрышное, а возни много,так что денег дай. Еще целый класс сериалов и фильмов про суду канут в лету, вроде того же Голиафа с Билли Боб Торнтоном.


  1. aborouhin
    05.12.2025 19:48

    Быстро собрать факты из кучи разрозненных документов - задача понятная и полезная. Правда, упирающаяся в то, что если эту кучу документов кинуть модели as is - обычно получается, мягко говоря, так себе, т.к. не учитывается контекст и метаданные (где у нас черновик договора, где финальная версия, и был ли он вообще подписан в итоге? каковы полномочия того, кто вот это подписал? и т.п.). А разметка для более качественного анализа трудоёмка и лишает смысла применение ИИ. См. массу публикаций про препроцессинг документов для RAG хотя бы, шишек набито изрядно.

    Второй момент. У нас тут не США и не Великобритания, стадии discovery в процессе нет, а соответствующие механизмы (истребование доказательств и пр.) в процессуальном законодательстве рудиментарны. Ни у кого нет заранее полного пакета документов от обеих сторон, который можно было бы разово загрузить в модель для анализа. Вся суть процесса часто и сводится к тому, что ещё и как добыть, что раскрыть, что утаить - и порой ориентироваться приходится в последний момент, когда новые документы всплывают непосредственно в заседании (да, нормы о заблаговременном раскрытии доказательств хоть формально в процессуальных кодексах и есть, но особым почётом на практике не пользуются).

    Но и это ладно. Допустим даже, мы нашли некое идеальное дело, по которому у нас есть заблаговременно собранный и качественно размеченный пакет документов. Мы выявили из него основные факты - и что? На этой стадии споры делятся на две категории. По большинству исход и так понятен любому юристу, ценность ИИ тут минимальна. По меньшей же части мы уходим в тонкие материи - или спор о праве, который может не иметь однозначного решения в практике, или разные подходы к оценке достоверности / относимости / допустимости доказательств (то самое внутреннее убеждение суда). LLM здесь будут бессильны, это совершенно субъективная сфера, где решающим может быть то, насколько убедительно и красноречиво выступит представитель той или иной стороны.