ФиззБазз ΟΕΔ. Практическое введение в формальную верификацию на зависимых типах Idris 2 / forpes.ru

Главная
ФиззБазз ΟΕΔ. Практическое введение в формальную верификацию на зависимых типах Idris 2

ФиззБазз ΟΕΔ. Практическое введение в формальную верификацию на зависимых типах Idris 2 +26

13.09.2025 19:30

knight_of_calculus 0 1800 Источник

Приветствую, странники Хабра! Меня зовут Алексей Васильев, я разработчик в команде Инновационных Технологий Страхового Дома ВСК. В погоне за производительностью программ, элегантностью их кода и масштабируемостью систем мы часто забываем о фундаменте: исполняет ли программа именно то, что мы от нее ожидаем? Как долго программа будет работать корректно? Цена ошибки может быть разной — разочарование пользователей, финансовые потери компаний… Печально, но в некоторых случаях это безопасность и жизнь людей.

Но ошибки — не досадные случайности. Это следствие утраты контроля над собственным намерением. Существует невообразимое число различных способов сломать код. И есть разные способы защитить программу от ошибок. Мы всегда заинтересованы в верификации. Пожалуй, самое явное подтверждение этому — обилие всевозможных тестов, которыми в современной разработке принято покрывать системы перед их запуском в использование. И даже не только перед запуском: разработка через тестирование, test‑driven development — сегодня де‑факто стандарт в промышленной разработке. Тестирование — это уже почти верификация. Но возможности тестирования в обеспечении защиты программ от ошибок и гарантии защищенности, которые оно предоставляет, фундаментально ограничены. По определению, любое тестирование — это всегда эмпирическая проверка ограниченного количества случаев. Таким образом мы соглашаемся на то, что не можем проверить все и везде, но что самое главное — не можем дать абсолютной гарантии того, что даже те случаи и тот код, который мы протестировали будут правильно работать всегда. Ведь проверка была эмпирической, а значит, сколько бы мы ни перепроверяли, вероятность того, что при очередном запуске все сломается или внезапно получится другой результат — остается.

Что же делать, если мы хотим большей уверенности в корректности и надежности того, что разрабатываем с таким трудом? На помощь приходит формальная верификация. Но первое слово скрывает необходимость выбора. С одной стороны, это безусловно (мы ожидаем некоторых формальных гарантий) должно привести нас в область высокой уверенности в надежности и корректности нашего ПО (high assurance systems). С другой стороны, это подразумевает, что начать мы должны с формализации наших ожиданий, aka «хотелок». Ведь показать формальную достоверность можно только для чего‑то, что само по себе полностью лишено неоднозначности. Получить абсолютно строгую, формальную постановку задачи — уже нетривиальная задача.

Вообще, область формальной верификации невероятно многогранна и глубока. Цель данной статьи — показать, что этот подход может быть доступен в широкой практике разработки и осветить основные инструменты, которые предоставляет для этого язык программирования Idris 2. А также продемонстрировать особенную красоту программ, корректных по построению. Мы сделаем это на примере всем известной задачи о ФиззБаззе. Материал не предполагает наличия глубокой теоретической подготовки читателя, только базовое знакомство с принципами функционального программирования, ну и… немного любви к математике.

Введение в Idris, зависимые типы и процесс Type‑Driven Development
Специфицируем задачу
Пишем решение. Доказываем корректность логики
Вводим альтернативную спецификацию, показываем эквивалентность
Строим программу. Верифицируем поведение

Введение в Idris, зависимые типы и процесс Type-Driven Development

Давайте начнем с небольшого знакомства с языком, который мы будем использовать. Idris — это функциональный язык программирования с зависимыми типами первого класса и возможностями системы доказательства теорем. Язык разработан Эдвином Брэди, британским компьютерным ученым, в настоящее время — ведущим научным сотрудником Сент‑Андрусского университета в Шотландии. Язык назван в честь поющего дракона Идриса из британской детской телепередачи «Паровозик Айвор».

Доктор Эдвин Брэди, автор языков программирования Idris и Whitespace — *Доктор Эдвин Брэди, автор языков программирования* *Idris* и *Whitespace*

Idris реализует наиболее выразительную систему типов по классификации лямбда‑куба Барендрегта — полиморфное лямбда‑исчисление высшего порядка с зависимыми типами (оно же исчисление конструкций, ). Это означает, что в нашем распоряжении присутствуют: параметрический полиморфизм, операторы над типами, и собственно, зависимые типы. Типы в Idris являются конструкциями первого класса. Все это, в некотором смысле, размывает уже саму границу между типом и значением. Вторая версия языка встраивает в систему типов механизмы стирания и линейности, основанные на теории квантитативных типов и аппарате субструктурных интуиционистских логик.

Мы еще посмотрим на все упомянутое выше в действии, однако сначала давайте проясним следующее: зачем нам все это, и почему именно Идрис? Идрис был спроектирован с замыслом продвижения методологии «разработка через типирование», Type‑Driven Development, по иронии судьбы разделившей акроним с популярным подходом, который мы уже упоминали выше. В разработке через типирование (далее в тексте TDD будет обозначать только ее), типы трактуются не просто как синтаксическое средство языка, но выступают как основной инструмент для построения программы. Набор введенных программистом типов рассматривается как своего рода план программы, а компилятор, с его подсистемами проверки и вывода типов, — как полноценный помощник, ассистент программиста, с которым они вместе постепенно строят программу, в соответствии с планом. Чем более выразительным является определенный в начале набор типов, тем больше уверенности в корректности итоговой программы — именно в смысле полноценности, точности реализации программистом своего исходного намерения (а не просто в смысле того, что программист не допустил синтаксических и грамматических ошибок в коде, и поэтому все скомпилировалось).

Цель Idris — сделать передовые подходы в программировании доступными для разработчиков‑практиков. И важная философия, которой придерживается проект, заключается в том, что Idris позволяет программисту использовать сильные методы, основанные на типизации: показывать инварианты данных, формально специфицировать поведение программы и доказывать ее свойства, но не требует этого. При желании, Идрис можно использовать просто как «обыкновенный» функциональный язык с типами первого класса. Также немаловажен приоритет в «официальном» позиционировании инструмента именно как, в первую очередь, языка программирования общего назначения, а не теорем‑прувера (что никак не запрещает использовать Идрис подобным образом, хотя и чувствуя все же некоторые недостатки по отношению к Rocq или Agda). Сам Эдвин Брэди любит характеризовать Идрис как «Pac‑Man‑complete»‑язык: он не только какой‑то там в теории завершенный по Тьюрингу, на Идрисе реально сделать полноценный работающий Pac‑Man!

Скрытый текст

И с возможностями Идриса гарантировать, в отличие от оригинальной игры, отсутствие BSOD на 256-м уровне.

Давайте же посмотрим на то, что такое зависимые типы на практике! Ставший уже классическим пример — это тип для списков, которые «знают свою длину», то есть наборов элементов определенного типа некоторой конкретной, фиксированной длины. В литературе по зависимым типам это традиционно называется «вектором» (хотя вообще говоря, здесь не предполагается какой‑то специфики именно вектора в смысле реализации динамического массива в непрерывной области памяти и вот этого всего):

data Vector  : (length : Nat) -> (elementType : Type) -> Type where
        Nil  : Vector Z _
        Cons : (elem : eType) -> (vect : Vector len eType) -> Vector (S len) eType

Это функциональная структура данных, которая описывает некоторое семейство типов, как функцию двух аргументов: натурального числа length и принимаемого типа данных elementType (тип элементов вектора), с результатом в виде некоторого типа, конкретного экземпляра данного семейства. Далее есть два конструктора, которые позволяют создавать эти конкретные экземпляры типов, таким образом как бы разбивая все семейство векторов на два подсемейства. Конструктор Nil позволяет создавать пустые векторы, то есть те, у которых length = Z ( это тип натурального нуля в аксиоматике Пеано: да, в Идрисе, в стиле Бурбакистов, натуральные числа начинаются с нуля). Но самое интересное происходит в Cons: это конструктор, то есть способ получить вектор из другого подсемейства типов, и он сам является функцией, которой нужны два аргумента: элемент некоторого типа eType , и уже имеющийся вектор с элементами именно этого типа eType, c длиной len, и тогда будет построен новый вектор из элементов eType с длиной ровно на единицу больше len (снова в соответствии с принципами Пеано, — это конструктор типа натурального числа, которое следует за некоторым другим натуральным:

$1 = S\,Z$
$2 = S\,(S\,Z)$
$3 = S\,(S\,(S\,Z))$

и т. д.).

То есть, обратите внимание, результирующие типы конструкторов Nil и Cons — это частные случаи Vector: когда его длина, по своей структуре, есть , и когда длина, по структуре, есть $S\,Nat$ . Таким образом, сам в итоге — это алгебраический тип данных (то есть тип‑сумма $Nil\,|\,Cons$ из типов‑произведений: в Nil и в Cons).

Вот тип функции‑конструктора Cons это и есть зависимый тип! Или, точнее, один из видов зависимых типов: зависимая функция. Действительно: какой именно тип Vector получится в результате применения функции Cons, зависит от того, какие конкретно значения elem и vect она получила в качестве аргументов (а сами значения elem и vect — это типы, частные случаи и соответственно. Вы уже перестали различать типы и значения?.. Хорошо!). Сам тип Vector тоже зависимый: это зависимая функция, чья область значений определяется значениями ее аргументов, что и показывают конструкторы, как специальные имена для подобластей значений Vector. Мы можем сказать, что зависимый АТД проиндексирован типом и параметризован типом (тип второго аргумента). Можно использовать более короткую запись:

data Vector  : Nat -> Type -> Type where
        Nil  : Vector Z _
        Cons : e -> Vector l e -> Vector (S l) e

Какая польза от зависимых типов? Вся суть в том, что при декларации сущности Vector мы в конструкторах ясно описали структурные зависимости (результата от необходимых для его получения посылок). И в награду за эту точность и ясность при описании того, что есть Vector и как он может возникнуть, тайпчекер будет далее нам помогать: защищать от возможностей совершить ошибки при определении функций, которые работают с данной сущностью. И даже более того, он будет помогать нам их определять!

БАЗА

Бенджамин Пирс. «Типы в языках программирования»

Тут пришло время немного подробнее остановиться на самом методе TDD. Его формула выглядит как последовательность инструкций для программиста:

Type : описываем тип
Define = даем определение
Refine : уточняем описание (переходим на шаг 1)

Давайте, используя этот подход, реализуем несколько полезных функций на векторах, которые мы специфицировали выше. Например, функция безопасного взятия первого элемента, головы вектора. Как говорит TDD, сперва мы должны описать ее тип:

safeVectHead : Vector (S l') eType -> eType

Здесь сразу приходит на ум объявить тип аргумента, как вектор, где длина имеет структуру length = S l'. Таким образом, мы просто не сможем передать в функцию пустой вектор: длина у вектора‑аргумента должна быть последователем некоторого натурального числа (сам l' может быть равен Z, но S l' — никак). Если где‑то в коде мы все‑таки попытаемся передать в safeVectHead аргумент типа Vector Z Type, компилятор выдаст ошибку. Если бы мы написали в типе просто Vector k eType, то тогда мы были бы недостаточно точны в выражении своего намерения. Компилятор понял бы нас так: в функцию позволяется передавать вектор любой длины с типом , в том числе нуль: k = Z. А написав наш первый вариант, мы ясно выразили, что принимаемый вектор не может быть пустым. Второй важный момент: мы прямо говорим, что вернуть функция должна некоторое значение ровно того же типа, что и элемент(ы) в принятом векторе. Итак, первый шаг: «Type», описание типа — самый важный. На нем мы договариваемся с компилятором о своих намерениях.

Реализация же, в данном случае, становится тривиальной:

safeVectHead : Vector (S l') eType -> eType
safeVectHead (Cons head tail) = head

Как и во многих современных функциональных языках, в Идрисе мы используем структурное сопоставление с образцом, чтобы написать определение функции. То есть мы буквально разбираем все возможные случаи входных параметров по их структуре. А какие виды векторов у нас бывают? Nil и Cons. Но Nil нет необходимости рассматривать, потому что он просто не пересекается с областью значений типа $Vector\,(S\,Nat)\,Type$ . Это кодомен Cons, который, в свою очередь «разбирается» на свои аргументы head и tail — элемент и вектор, как мы описывали выше. При этом компилятор может вывести тип tail: это $Vector\,l'\,eType$ , где (т.е. Z или S Nat). И здесь у нас просто не остается вариантов, кроме правильного: вернуть head. Мы не сможем, например, так просто «умудриться» вернуть здесь safeVectHead tail (типа зачем‑то рекурсивно вызвать функцию на хвосте списка) — этот вариант не пройдет структурную унификацию параметров: опять же, safeVectHead ожидает аргумент с длиной вида $S\,Nat$ , а длина в tail — это просто какой‑то Nat, в том числе это может быть нуль (т. е. tail может быть Nil). То есть, в данном случае, правильное определение функции буквально автоматически выводится из ее типа.

Нет необходимости в проверках времени выполнения: что принятый вектор не оказался пустым, или что мы не выбрали для возврата что‑то не то — все решено на этапе компиляции. И компилятор также может проверить, что наша функция покрывающая (определена на всех входах) или даже тотальная (завершается на всех входах) — зависит от режима, устанавливаемого директивой %default (в Idris 2 по умолчанию %default covering). Почему все оказалось так удобно и легко? На самом деле, благодаря нашей удачной спецификации для вектора, а именно конструкторам Nil и Cons. Когда мы описывали вектор, мы декларировали, что есть два способа его построить: Nil «по первому слову» создаст пустой вектор, а Cons потребует предоставить ему элемент и уже существующий вектор, а последний мог быть построен снова либо с помощью Nil, либо с помощью Cons. Все это приводит нас в итоге к тому, что любой вектор, по нашей спецификации — либо пустой, либо прямое произведение элемента и вектора, и вот тут и сокрыт секрет удобства реализации safeVectHead. Скажем, если в рамках данной спецификации мы захотим реализовать функцию взятия последнего элемента в векторе, нам придется постараться немного больше (стать чуть более многословными в определении функции; вы можете увидеть этот вариант в репозитории туториала на ГитХабе). Или же — изменить спецификацию (вот он, третий шаг «Refine»). Как именно, подумайте сами (это совсем несложно, все подсказки мы уже предоставили выше в тексте; ну или ответ всегда можно найти в стандартной библиотеке Идриса).

Другой пример — соединение двух векторов. Опять же, на первом шаге определимся с намерением:

join2Vectors : Vector m e -> Vector n e -> Vector (m + n) e

Все уже максимально прозрачно: мы ожидаем два вектора с элементами одного типа и некоторыми длинами , а вернем вектор из элементов такого же типа длины ровно . Переходим к определению:

join2Vectors : Vector m e -> Vector n e -> Vector (m + n) e
join2Vectors Nil                    v2 = v2
join2Vectors (Cons v1_head v1_tail) v2 = Cons v1_head (join2Vectors v1_tail v2)

Это стандартный подход с разбором случаев по некоторому аргументу и рекурсией. Обратите внимание вот на что: благодаря структуре зависимостей в результирующем типе функции, а также спецификации Vector, программисту не получится по ошибке написать, например, такой рекурсивный вызов: join2Vectors v2 v1_tail («случайно» перепутали стороны при соединении).

Подумайте, почему именно:

Важны, на самом деле, все детали: и определенная выше зависимость (S len) в результирующем типе Cons, и порядок типов‑слагаемых в результирующем типе join2Vectors. Если бы в спецификации результата Cons мы написали (S _), то есть требовали бы просто непустой вектор, или вообще произвольное (нет ограничений на длину результата Cons), то реализация ошибочного варианта join2Vectors v2 v1_tail стала бы возможной. Мы можем попробовать сломать реализацию иначе: сделать длину в результате join2Vectors типа , чтобы сработала перестановка в рекурсии. Но тогда тайпчекер уже не примет ответ v2 на строчке выше. В общем, суть в том, что так просто сделать неправильно, «случайно» ошибиться уже не получится — придется реально стараться и убеждать компилятор в своей правоте. А сделать правильную, в смысле консистентности со спецификацией, реализацию становится проще.

Также здесь мы не сможем попытаться соединить хвост с хвостом: join2Vectors v1_tail v1_tail и т. п. Не пройдут никакие варианты, которые не убеждают тайпчекер в равенстве типов получаемого результата и специфицированного. Чтобы в этом убедиться и разобраться, как именно зависимости влияют друг на друга, полезно провести анализ возмущений — немного «поломать» спецификацию и зависимости в типах, и посмотреть, что отвечает компилятор на разные варианты.

Мы уже научились брать первый и последний элементы из вектора, давайте реализуем функцию взятия элемента по произвольному индексу (тоже типобезопасную, разумеется). И вот тут, на первом шаге «Type», мы задумаемся. А как нам специфицировать, чтобы индекс не мог выйти за пределы размера вектора? Без всяких проверок времени выполнения. На помощь спешит математика. Давайте подумаем, векторы у нас проиндексированы типом , область значений которого не ограничена сверху, т. е. элементы . Взять элемент по индексу можно только из непустого вектора, но если это конкретный вектор, то число элементов в нем конечно (т. к. длина есть конкретный Nat). Но это значит, что индекс элемента вектора должен принадлежать конечному множеству элементов (а не открытому справа Nat). Значит, для индекса нам нужно объяснить Идрису, что такое конечное множество. Аналогично спецификации вектора, введем тип для конечного множества:

data Finite  : (cardinality : Nat) -> Type where
        Zero : Finite (S _)
        Next : Finite n -> Finite (S n)

Это АТД, который также проиндексирован типом , и также имеет два конструктора: Zero, для взятия (или «указания на») нулевого элемента из конечного множества ненулевой мощности, и Next, для взятия следующего элемента из конечного множества ненулевой мощности, если был уже взят предыдущий элемент. То есть Finite здесь можно читать как «выбери из конечного множества», или «ты можешь выбрать конечное число раз». Что можно выбрать? Произвольный нулевой элемент и произвольный элемент, следующий за кем‑то (в порядке конкретного множества). То есть Zero, это на самом деле «возьми первый раз». А Next это «возьми еще». Но обратите внимание, ни один конструктор не захватывает в свой кодомен Finite Z. Это значит, что выбрать элемент из пустого множества мы не сможем никак (даже если где‑то мы объявим тип $Finite\,0$ , населить этот тип нет способов). И также это значит, что если мы объявили некоторый тип $Finite\,k$ , то конструкторы Zero и Next позволят нам выбирать элементы из Finite k максимум раз. Первый раз будет с помощью Zero, а далее Next вплоть до $k = S\,n$ , то есть не превысит .

Скрытый текст

Поначалу может быть непросто увидеть смысл спецификации за описанием некоторого АТД. Держите в уме вот что: мы находимся в рамках конструктивной математики. То есть мы в первую очередь показываем, как мы можем что‑то получить (из того, что уже есть), и нам не столь важно что это «физически». Не пытайтесь мыслить $Finite\,k$ как контейнер для k элементов. Это абстрактная совокупность (как писал Кантор:

множество есть многое, мыслимое нами как единое

), т.е. Finite «есть» нечто эфемерное, что соединяет k различимых предметов в единое целое логическим образом. Все определения data в нашем коде выражают некоторые свойства или инварианты данных.

Теперь же, имея возможность ограничивать мощностью конечного множества, мы можем показать, как именно безопасно будет происходить взятие по индексу элемента из вектора:

getElementAt : (index : Finite n) -> (vector : Vector n eType) -> eType

Длина вектора-аргумента зависит от мощности множества его индексов. То есть компилятор на этом месте понимает: функция объявлена для любого индекса из конечного множества и вектора с длиной, равной мощности этого множества. Определим функцию:

getElementAt : (index : Finite n) -> (vector : Vector n eType) -> eType
getElementAt Zero     (Cons head tail) = head
getElementAt (Next i) (Cons head tail) = getElementAt i tail

Снова заметим, что рассматривать пустые вектора здесь нет смысла. Это невозможно, так как не может существовать свидетельств (построенных значений) типа $Finite\,Z$ . Компилятор Идриса в данном случае может это понять сам, но если очень хочется, можно такие случаи прописать явно, с помощью ключевого слова impossible:

getElementAt _ Nil impossible	-- в определении getElementAt
safeVectHead Nil impossible		-- в определении safeVectHead

Забегая вперед, можно сказать, что вся суть программ, корректных по построению — в использовании алгебраических зависимых типов для моделирования задачи и в следовании стратагеме «make illegal states unrepresentable». Мы отказываемся от идеи валидации данных. Вместо этого мы моделируем предметную область так, чтобы все возможные высказывания в ней имели смысл. Поскольку Идрис позволяет производить вычисления внутри объявлений типов, мы можем специфицировать сколь угодно нетривиальные свойства и поведение наших программ. Единственный потолок здесь — воображение и навык разработчика.

В документации Идриса и его стандартной библиотеке немало хороших примеров использования зависимых типов, а также других возможностей языка. Поэтому, интересующиеся читатели смогут продолжить свое изучение там. А сейчас нам пора переходить к основной задаче!

Специфицируем задачу

Давайте начнем с постановки задачи. Вот классическая формулировка:

Напишите программу, которая выводит на экран числа от до включительно. Но вместо чисел, которые делятся на три, выведите «Fizz», а вместо чисел, которые делятся на пять — «Buzz». Если число делится и на три, и на пять, выведите вместо него «FizzBuzz».

Исходно это такая детская игра‑считалка, цель которой — обучение детей правилам деления. Вот и мы, в своем подходе к реализации программной логики, будем, в некотором роде, именно обучать программу понимать (а на самом деле прояснять для себя вопрос), что такое делимость и как именно ее правильно использовать для решения поставленной задачи. Именно ясное и строгое выражение понятий будет фундаментом, на котором мы построим реализацию, цель которой — доказательная корректность. Вот этот момент очень важно осознать заранее, перед тем, как начать разработку. Давайте посмотрим на следующий пример реализации на Python:

for i in range(1, 101): print('Fizz' * (i % 3 == 0) + 'Buzz' * (i % 5 == 0) or i)

Это правильно работающий ФиззБазз. Вернее, один пример из бесчисленного множества реализаций правильно работающих ФиззБаззов. В данном случае мы видим, что программист явно ценит лаконичность, простоту и изящество кода: действительно, это без лишних слов перевод исходной формулировки задачи с естественного языка на язык Питона. Но положительные стороны данного примера обязаны его конкретности. Если мы захотим обобщать данное решение: вводить новые правила вывода слов в зависимости от делимости чисел, расширять диапазон работы программы и т. п., при этом с условиями проверяемости результата на правильность и наличия некоторой систематизированности в коде — нам потребуется вводить абстракции. Пример движения в этом направлении (не выходя за рамки Python) можно увидеть, например, здесь. Объем решения, по сравнению с однострочником, приведенным выше, увеличивается примерно в 200 раз (как внушительно могут выглядеть цифры, правда?), но примерно ¾ кода — (property‑based) тестирование. Решение стало расширяемым (мы легко можем добавить новое правило в игру), но показательно, что необходимость убедиться в том, что решение осталось правильным, растет быстрее, чем основная система.

Гибкость — не единственное, за что приходится «платить» доверием. Вот пример развития решения в совершенно другом направлении. За поражающую воображение производительность приходится платить еще больше: ~400 строк кода самого решения и ~800 строк — весь пост целиком! Да, это текст поста вместе с кодом решения, но мы будем считать пост — документацией к системе, и код в ней приводить просто необходимо, т. к. комментарии идут по тексту реализации, и если убрать код, станет просто не понятно, о каком конкретно хитром битовом сдвиге или другом хакерском трюке идет речь в данный момент (и наоборот, если убрать сопровождающие комментарии, то в том, какую вообще задачу решает этот код, не сразу разберется даже опытный программист).

Что объединяет все решения, приведенные выше (лаконичный, гибкий, ультраоптимизированный подходы)? Без тени иронии или критики — это прекрасные инженерные решения и отличные примеры развития в разных парадигмах разработки. Каждое из трех имеет свои сильные стороны, которые сложно превзойти. Но есть и одна совершенно общая слабость, которой они поражены — хрупкость доверия к системе. Вот ее анамнез:

Программист на 90% верит, что штуки вроде 'Fizz' * (i % 3 == 0) правильно делают свою работу: действительно проверяют делимость на 3 и вернут «Fizz» в правильном случае (как‑то умножив строку на логическое значение, или оно будет приведено к целому, перегрузка операторов… что вообще здесь на самом деле происходит понимает только высококвалифицированный заклинатель змей). И мы так же абсолютно верим программисту, что сложная битовая маска в примере ультрапроизводительной реализации вычислена верно, что программист вообще правильно понял задачу, которая держится на словесной спецификации (и легко расходится с кодом при малейших изменениях). Вероятность ошибки программиста есть всегда, и с ростом кодовой базы она растет (супер)экспоненциально.
Когда мы осознаем, насколько велика вероятность ошибки, мы понимаем необходимость скрупулезного тестирования именно корректности реализации. Включается «доверяй, но проверяй». Поскольку нет строгих способов «запретить» создать программу, которая может выдать «Bazz» вместо «Buzz» для n = 5 (или вообще программист перепутает 5 и 15 в проверке делимости), мы можем лишь проверять результат и констатировать факт — правильно получилось или нет. Но тесты могут быть неполными, могут содержать ошибки сами, и всегда могут лишь среагировать на баг после его появления (а система/обновление уже неделю как живут на проде..). Строго говоря, тесты все‑таки валидируют (проверяют результат процесса), а не верифицируют (гарантируют сам процесс) корректность.
В итоге, во всех приведенных выше реализациях, корректность есть их внешний атрибут: правильность программы не вытекает напрямую из нее самой, а «навешивается» сверху через тесты, проверки, в итоге вся система держится на доверии.

Мы постараемся решить именно эту проблему: не сделать очередную правильно работающую реализацию с помощью очередного набора инструментов, а построить систему, в которой состояния с неверной логикой ФиззБазза принципиально невозможны и отвергаются на этапе сборки исполняемого кода из исходного.

Очевидно, что ключевое понятие в нашей задаче — делимость одного числа на другое нацело. Специфицировать делимость можно по‑разному: мы уже видели наиболее распространенный пример с проверкой остатка от деления. Нам нужен тип, выражающий это свойство, и поскольку в целом мы собираемся работать в области натуральных чисел, нам бы хотелось использовать как можно более прямое и очевидное определение относительно них (а не использовать, например, репрезентацию числа в некоторой системе счисления, суммы цифр в записи чисел и т. п.). Давайте введем такой тип:

data Divisible : (numer : Nat) -> (denom : Nat) -> Type where
        SelfDivisible : Divisible (S x') (S x')
        NextDivisible : Divisible (S n') (S d') -> Divisible (S n' + S d') (S d')

Как мы уже видели во введении, это достаточно общий паттерн для определения типов: мы описываем некоторый тривиальный случай, который строится «Ex nihilo», и способы построения «менее очевидных» вариантов. В данном случае, мы говорим, что само на себя число делится тривиально, для этого не нужно каких‑то доказательств, это аксиома. Но выполняется такое свойство, очевидно, только для отношений, в которых делимое и делитель равны. А в качестве нетривиального случая мы можем ввести понятие «следующей делимости», с посылкой вида «если делится на » и выводом «значит делится на ». Обратите внимание, в результатах типов конструкторов мы везде представляем и делимое и делитель как последователей некоторого натурального числа. Вводя такую структуру мы сразу «уберегаем» наш домен делимости от любых отношений с нулем, как в числителе, так и в знаменателе. В том смысле, что они могут быть описаны формально, как типы:

divOfZero : Divisible 0 1
divByZero : Divisible 1 0
undefined : Divisible 0 0

, но населить такие типы реальными значениям возможности нет. Это важный прием: мы не только абстрактно моделируем делимость (формулируем свойство), мы сразу думаем о конкретной предметной области — да, ноль делим на ноль, но конкретно такого частного в нашем ФиззБаззе не будет (конкретное частное не определено математически, а логически использование предикатов делимости с нулем неявно превращает доказательства в математические софизмы; в конце концов, нам такое просто не нужно в домене).

Имея фундаментальное понятие делимости, мы сразу можем описать тип, отвечающий за возможные состояния нашей программы:

data GameState : (number : Nat) -> Type where
        Number   : Not (Divisible n 3) -> Not (Divisible n 5) -> GameState n
        Fizz     : Divisible n 3       -> Not (Divisible n 5) -> GameState n
        Buzz     : Divisible n 5       -> Not (Divisible n 3) -> GameState n
        FizzBuzz : Divisible n 3       -> Divisible n 5       -> GameState n

То есть для состояния игры, которое является функцией с некоторым натуральным параметром, у нас есть 4 возможных конструктора, и все нетривиальные, то есть требуют доказательств. Состояние требует свидетельства, что переданный аргумент не делится на , и свидетельства, что переданный аргумент не делится на . Not это базовая функция‑обертка, которая для каждого возвращает функцию :

Not : Type -> Type
Not x = x -> Void

То есть мы могли бы все то же самое записать и так:

Number : ((Divisible n 3) -> Void) -> ((Divisible n 5) -> Void) -> GameState n

, очевидно, что с Not нагляднее. Конструкция же сама по себе означает, что наличие терма типа приводит к противоречию. это встроенный пустой тип, который не имеет конструкторов. Вообще. Таким образом, в любой функции, результирующим типом которой является , хотя бы один аргумент обязательно тоже должен быть (иначе нам просто нечего вернуть, а сам по себе Void никак не построить). Функции, результирующие в пустой тип, таким образом, можно использовать для доказательств от противного, т. к. Void также описывает тип тривиально ложного высказывания. Мы еще увидим, как это работает на практике.

Конструкторы всех состояний в нашей программе требуют пары доказательств для своего аргумента, то есть свидетельств того, что его можно «обернуть» в типы или $Not\,Divisible$ с делителями, соответствующими постановке задачи. Это и есть формальная спецификация логики нашего ФиззБазза. Остался еще один шаг. Сейчас наша логика это такая «вещь в себе»: есть делимости и есть, строго связанные с ними, состояния игры в ФиззБазз, но исходная постановка задачи требует взаимодействия с внешним миром, то есть чтобы программа «говорила» нам строками о том, как она считает. Для этого нам потребуется специфицировать интерфейс Show:

{n : _} -> Show (GameState n) where
        show (Number   _ _) = show n
        show (Fizz     _ _) = "Fizz"
        show (Buzz     _ _) = "Buzz"
        show (FizzBuzz _ _) = "FizzBuzz"

это тип, проиндексированный натуральным параметром , а интерфейс Show связывает его значения со строками, определяя конкретные методы для каждого состояния игры. Для всех состояний, кроме Number, мы возвращаем конкретные заданные строки, а в случае Number вызываем show на аргументе параметра состояния n (поэтому мы должны описать его как неявный параметр вначале, чтобы он попал в контекст методов show), который есть натуральное число, а для них интерфейс определен в стандартной библиотеке. То есть, по сути мы перегружаем один метод интерфейса («класса» или «категории» типов, в которую мы добавляем GameState) в зависимости от конкретных областей значений его аргумента. Параметры доказательств состояния нас не интересуют в контексте методов интерфейса Show, поэтому мы их описываем пропусками (а могли бы интересовать, если бы нам было важно, например, какая именно это делимость: тривиальная или «последующая»). Мы перевели исходную словесную постановку задачи на формальный язык типов в нашей программе.

Теперь примерно понятно, как выстроить план реализации программы:

-- логика вычисления игрового мира
gameLogic : (number : Nat) -> GameState number

-- пока оставим такой очень грубый набросок, очевидно,
-- в этой спецификации не до конца выражено желаемое устройство процесса
-- (first : Nat) -> (last : Nat) -> ... -> IO ()
playFizzBuzz : (first : Nat) -> (last : Nat) -> IO ()

-- запуск игры
main : IO ()
main = playFizzBuzz 1 100

Пока, конечно, это не окончательный план построения программы, в playFizzBuzz мы лишь грубо обозначили идею, как мы хотим видеть игровой процесс. Вероятно, на самом деле мы должны будем получить некоторое множество состояний GameState и перевести их в вывод IO (для чего у нас уже есть интерфейс), и, разумеется, мы должны будем отразить это в спецификации (то есть явно описать всю логику, согласно которой формируется итоговый вывод программы на экране). Иначе в итоге снова получим процесс, который держится на доверии, что из чисел каким‑то магическим образом получаются правильные выводы. Но, спокойствие, до этого мы обязательно дойдем.

На самом деле, мы только что сделали самый важный шаг. Мы смоделировали (пусть и пока размыто относительно конечного бизнес‑процесса), предметную область в системе типов. Далее, в рамках этой спецификации, возможны только корректные состояния и непротиворечивые высказывания. Программисту для реализации потребуется всего лишь показать, как именно возможны правильные высказывания. Здесь важно остановиться, чтобы понять — если спецификация размыта, как сейчас, то и множество «корректных» высказываний будет больше того, что мы на самом деле желаем. А мы ведь хотели, чтобы реализовать что‑то заведомо непозволительное, типа признать неделимое делимым или напечатать «Fizz» для состояния Buzz не было принципиальной возможности. Пока очевидная дыра в нашей спецификации заключается в том, что она в программе позволит получать выводы на экран, минуя всю нашу прекрасно смоделированную логику. То есть сейчас мы в общих чертах представляем, как внутри должен быть устроен мир нашего ФиззБазза, но пока не видим, как гарантировать корректность процесса взаимодействия с ним.

Есть что‑то очень особенное в разработке, которая ведется таким образом. А именно то, что написание и отладка программы превращаются, по сути, в подлинное изучение предметной области. Мы больше не «ищем баги в каком‑то коде», не выискиваем места, где «какой‑то там индекс может выйти за пределы какой‑то области памяти». Мы проясняем для себя фундаментальные отношения между понятиями в нашей предметной области и устройство ее процессов. Это может выглядеть забавно для игры в ФиззБазз, но в «настоящих» предметных областях это может значить очень много. Вместо дебага — изучение. Буквально построение знаний.

Пишем решение. Доказываем корректность логики

Настало время разрешить ФиззБазз! Обо всем по порядку, давайте сначала построим реализацию игровой логики:

gameLogic : (number : Nat) -> GameState number
gameLogic n with (decideDivisible3 n, decideDivisible5 n)
      _ | (No  proofNotFizz, No  proofNotBuzz) = Number   proofNotFizz proofNotBuzz
      _ | (Yes proofFizz,    No  proofNotBuzz) = Fizz     proofFizz    proofNotBuzz
      _ | (No  proofNotFizz, Yes proofBuzz)    = Buzz     proofBuzz    proofNotFizz
      _ | (Yes proofFizz,    Yes proofBuzz)    = FizzBuzz proofFizz    proofBuzz

Вообще здесь реально нет вариантов сделать неправильно. GameState number требует, согласно спецификации, пары доказательств для своего аргумента, относительно возможности его делимости на и на . Иначе состояние просто не построить. Давайте представим, что у нас есть процедуры для осуществления подобных выводов:

decideDivisible3 : (input : Nat) -> Dec (Divisible input 3)
decideDivisible5 : (input : Nat) -> Dec (Divisible input 5)

Паттерн Dec — фундаментальный инструмент для построения разрешающих процедур:

data Dec : Type -> Type where
        Yes : (proof_ : prop)     -> Dec prop
        No  : (contr_ : Not prop) -> Dec prop

Технически это очень простой тип‑обертка, который позволяет сказать о выполнении некоторого свойства либо «Да», требуя явно предоставить свидетельство этого свойства, либо «Нет», с требованием явного свидетельства того, что свойство неверно: . То есть это как «строгий Maybe», только Maybe мы используем, когда хотим гибкости в рассуждениях, а когда хотим надежности, нам нужно не «может быть» а строго «да/нет». Это ровно та форма заключений, которую требует наш GameState, и в gameLogic мы с помощью паттерн‑матчинга просто анализируем полученные заключения, и строим соответствующие состояния.

Скрытый текст

Если реализовать процедуру оценки делимости с помощью Maybe, мы получим принципиально иной смысл: Just будет утверждать наличие свойства, однако Nothing скажет «мы не обнаружили» это свойство или «у нас не получилось» доказать свойство. Это не то же самое, что утверждать «мы доказали, что свойство неверно», что говорит No в Dec.

Мы движемся к самому ядру логики нашего ФиззБазза, теперь нам требуется реализовать автоматические процедуры разрешимости делимости на 3 и на 5 для произвольного аргумента. Технически, для этого нам нужно автоматически генерировать термы типов $Divisible\,input\,3$ , $(Divisible\,input\,5) → Void$ и т. д. Как это сделать? Спецификация позволяет нам утверждать делимость двумя способами: SelfDivisible и NextDivisible. Значит, мы должны утверждать или отрицать делимость на основании этих двух предикатов. Но как быть для произвольного аргумента? Вспомним, что у нас вообще есть две базовые техники доказать что‑то:

прямо рассмотреть все возможные ситуации и сделать выводы, либо
разделить задачу на тривиальные (их должно быть конечное число) и нетривиальные (все остальные) случаи, и показать возможность судить о последних на основании первых с помощью корректного логического перехода.

Очевидно, в данном случае, мы должны рассуждать вторым образом, то есть по индукции. В качестве ее базы мы можем взять набор утверждений относительно тривиальных случаев, то есть отношений, в которых делимое меньше или равно делителю. Благо что делители у нас небольшие, значит и набор утверждений для базы индукции разрешающих процедур описать не составит большого труда. А потом потребуется сделать вспомогательные процедуры для перехода от утверждения о (не)делимости с некоторым аргументом к утверждению относительно следующей (не)делимости (у нас «следующая» это

$\frac{делимое + делитель}{делитель}$ ).

Мы понимаем, что из всех базовых случаев свойство делимости будет утверждаться только в последнем, то есть когда делимое и делитель равны (и для этого нам не потребуется каких‑то дополнительных функций, т. к. есть явный конструктор свойства делимости для таких отношений). Так что мы распишем доказательства неделимости базовых отношений, где делимое меньше делителя. Давайте так и напишем все это — от частного к общему, от деталей к идее. Вот наши тривиальные случаи неделимости:

-- база индукции для делителя 3
proof0NotDivBy3 : Not (Divisible 0 3)
proof0NotDivBy3 _ impossible

proof1NotDivBy3 : Not (Divisible 1 3)
proof1NotDivBy3 SelfDivisible                         impossible
proof1NotDivBy3 ({n', d' : Nat} -> (NextDivisible _)) impossible

proof2NotDivBy3 : Not (Divisible 2 3)
proof2NotDivBy3 SelfDivisible                         impossible
proof2NotDivBy3 ({n', d' : Nat} -> (NextDivisible _)) impossible

impossible — это ключевое слово, которое используется для обозначения определений в невозможных случаях. Оно как бы освобождает программиста от необходимости писать конструктивную правую часть (которой не существует) в определениях, в которых в левой части содержится невозможная комбинация аргументов. Очевидно, что просто невозможно вызвать ни конструктор SelfDivisible, ни конструктор NextDivisible на конкретных значениях, указанных в типах при объявлении доказательств выше, это прямо противоречит дефинициям конструкторов. То есть impossible здесь — это такой «Капитан Очевидность», которого мы призываем, чтобы получить доказательства неделимости отношений, где делимое строго меньше делителя.

Стоит также добавить, что impossible это не какой‑то unsafe cast вроде believe_me, это вполне легитимное указание компилятору проверить невозможность паттерна. Если тайпчекер (на этапе унификации параметров) не сможет найти невозможную комбинацию, он вернет ошибку:

twoPlusTwoNotFive : Not (2 + 2 = 5)
twoPlusTwoNotFive Refl impossible			-- верно

twoPlusTwoIsFour : (x = 2) -> (x + x = 4)
twoPlusTwoIsFour Refl impossible			-- ошибка, аргумент Refl возможен
twoPlusTwoIsFour Refl = Refl			    -- верно

Проще говоря, все заявленные программистом impossible проверяются компилятором. Однако метод консервативен (поскольку это именно проверка тайпчекером паттернов на стадии унификации параметров, не более), поэтому не стоит ожидать от него слишком много:

thereIsA : a -> Not (Not a)
thereIsA _ _ impossible	    -- ошибка, чисто с точки зрения унификатора все ok,
thereIsA a notA = notA a	-- хотя в действительности, конечно, невозможно иметь
					        -- предикат и его отрицание одновременно

Скрытый текст

Ну и в целом не стоит забывать о том, что задача вывода на зависимых типах, в общем случае, неразрешима.

Сам же Refl — это единственный конструктор в типе , выражающем свойство пропозициональной эквивалентности типов. Refl утверждает частный случай эквивалентности при наличии рефлексивного отношения между левой и правой частями выражения. Проще говоря, когда термы могут быть редуцированы к общей нормальной форме, обеспечивающей синтаксическую эквивалентность:

data Equal : forall a, b . a -> b -> Type where
     [search a b]
     Refl : {0 x : a} -> Equal x x

Повторим те же базовые доказательства для нашего второго делителя, пяти:

-- база индукции для делителя 5
proof0NotDivBy5 : Not (Divisible 0 5)
proof0NotDivBy5 _ impossible

proof1NotDivBy5 : Not (Divisible 1 5)
proof1NotDivBy5 SelfDivisible                         impossible
proof1NotDivBy5 ({n', d' : Nat} -> (NextDivisible _)) impossible
 
proof2NotDivBy5 : Not (Divisible 2 5)
proof2NotDivBy5 SelfDivisible                         impossible
proof2NotDivBy5 ({n', d' : Nat} -> (NextDivisible _)) impossible

proof3NotDivBy5 : Not (Divisible 3 5)
proof3NotDivBy5 SelfDivisible                         impossible
proof3NotDivBy5 ({n', d' : Nat} -> (NextDivisible _)) impossible

proof4NotDivBy5 : Not (Divisible 4 5)
proof4NotDivBy5 SelfDivisible                         impossible
proof4NotDivBy5 ({n', d' : Nat} -> (NextDivisible _)) impossible

Обратите внимание, что в случаях, где делимое есть нуль, мы можем обобщить оба случая конструкторов в одно определение. Просто приятное удобство, тайпчекер Идриса с этим справляется. Для отличного от нуля делимого нам приходится быть немного более многословными.

Далее, для случаев, когда делимое и делитель равны, мы в разрешающих процедурах, очевидно, сможем просто утверждать делимость с помощью SelfDivisible. Теперь нам нужен тот самый логический переход, когда мы понимаем неделимость некоторого данного отношения и хотим рассуждать о свойстве следующего отношения. То есть:

proofNextNotDivBy3 : Not (Divisible (S n') 3) -> Not (Divisible (S n' + 3) 3)
proofNextNotDivBy5 : Not (Divisible (S n') 5) -> Not (Divisible (S n' + 5) 5)

Ну тут же все просто, верно?.. Щас распишем легко такую формальность, давайте лучше сначала сделаем серьезную работу — соберем процедуры разрешения делимости целиком:

decideDivisible3 : (input : Nat) -> Dec (Divisible input 3)
decideDivisible3 Z                  = No  proof0NotDivBy3
decideDivisible3 (S Z)              = No  proof1NotDivBy3
decideDivisible3 (S (S Z))          = No  proof2NotDivBy3
decideDivisible3 (S (S (S Z)))      = Yes SelfDivisible
decideDivisible3 (S (S (S (S x')))) with (decideDivisible3 (S x'))
      _ | Yes proof_ = rewrite proofCongPlus3 x' in Yes (NextDivisible      proof_)
      _ | No  contr_ = rewrite proofCongPlus3 x' in No  (proofNextNotDivBy3 contr_)

decideDivisible5 : (input : Nat) -> Dec (Divisible input 5)
decideDivisible5 Z                          = No  proof0NotDivBy5
decideDivisible5 (S Z)                      = No  proof1NotDivBy5
decideDivisible5 (S (S Z))                  = No  proof2NotDivBy5
decideDivisible5 (S (S (S Z)))              = No  proof3NotDivBy5
decideDivisible5 (S (S (S (S Z))))          = No  proof4NotDivBy5
decideDivisible5 (S (S (S (S (S Z)))))      = Yes SelfDivisible
decideDivisible5 (S (S (S (S (S (S x')))))) with (decideDivisible5 (S x'))
      _ | Yes proof_ = rewrite proofCongPlus5 x' in Yes (NextDivisible      proof_)
      _ | No  contr_ = rewrite proofCongPlus5 x' in No  (proofNextNotDivBy5 contr_)

Все в целом очевидно, как объясняли выше, строим индукцию на базе тривиальных доказательств. Когда рассмотрели все конкретные тривиальные случаи, описываем один обобщенный нетривиальный случай: количество конструкторов в образце аргумента делимого равно $новое\,ядро\,S\,x'$ . На новом ядре делаем рекурсивный вызов (прямо в сопоставлении с образцом, круто?!) разрешающей процедуры и оцениваем результат. Если относительно предыдущей делимости мы получили утвердительный ответ, тогда строим следующую прямо по спецификации, иначе используем наш логический переход (щас распишем его, щас..) чтобы показать следствие неделимости следующего отношения на основе неделимости данного. А что за rewrite здесь появились?

rewrite это указание произвести в терме подстановку согласно некоторому равенству с явным предикатом (есть еще синтаксис replace с неявным выводом свойства). Эти средства реализуют принцип «неразличимости тождественных»: если два терма равны, то они имеют одинаковые свойства (подробнее). Нам это нужно, чтобы успокоить разволновавшийся тайпчекер, заявляющий:

While processing right hand side of with block in decideDivisible3. Can't solve constraint between: plus x' 3 and S (S (S x')).

While processing right hand side of with block in decideDivisible5. Can't solve constraint between: plus x' 5 and S (S (S (S (S x')))).

Все нормально, такое бывает, когда мы получаем возможность производить вычисления на типах во время компиляции. Чтобы показать, что прибавить натуральное число это то же самое, что сделать столько же шагов вправо по натуральному ряду, мы докажем две леммы о конгруэнтности структур типов данных операций:

proofCongPlus3 : (x : Nat) -> S (S (S x)) = x + 3
proofCongPlus3 Z     = Refl
proofCongPlus3 (S k) = cong S (proofCongPlus3 k)

proofCongPlus5 : (x : Nat) -> S (S (S (S (S x)))) = x + 5
proofCongPlus5 Z     = Refl
proofCongPlus5 (S k) = cong S (proofCongPlus5 k)

cong доказывает эквивалентность результатов применения функции на эквивалентных аргументах:

cong : (0 f : t -> u) -> (0 p : a = b) -> f a = f b
cong f Refl = Refl

Так, там осталась одна формальность, переходы proofNextNotDivBy3 и proofNextNotDivBy5. Для SelfDivisible, очевидно, невозможная комбинация сразу, а для NextDivisible просто получаем противоречие из «наличия» одновременно термов делимости (следующее «типа делится», но значит был аргумент для конструктора NextDivisible) и неделимости (только что выше делали такое в примерчике thereIsA), так что все предельно просто:

proofNextNotDivBy3 : Not (Divisible (S n') 3) -> Not (Divisible (S n' + 3) 3)
proofNextNotDivBy3 contr_curr proof_next = ?whatNow

Заглянув в дыру ?whatNow видим простую задачу:

 0 n' : Nat
   proof_next : Divisible (S (plus n' 3)) 3
   contr_curr : Divisible (S n') 3 -> Void
 ------------------------------
 whatNow : Void

Про дырки

В программах на Идрисе существует такое понятие, как compiling holes — т. н. «дыры компиляции», еще не написанные части программы. Они выглядят как произвольные имена, начинающиеся со знака вопроса, например ?some_expression. Примечательно, что компилятор с ними прекрасно уживается. То есть мы можем скомпилировать программу с «дырками» в коде, и даже собрать исполнимый файл и запустить его! Работать все, в таком случае, разумеется будет до того момента, пока исполнение не наткнется и не провалится в какую‑нибудь unimplemented дыру. Это нужно для того, чтобы программист мог вести разработку инкрементально, а также мог в процессе написания программы увидеть процесс «глазами тайпчекера», т. е. узнать условия (какие параметры каких типов имеются в контексте) и задачу (что требуется построить, значение какого типа). Помимо предоставления этой информации, компилятор может пробовать самостоятельно решить задачу.

Вообще интерактивное взаимодействие с компилятором Идриса — это отдельная интереснейшая тема, но этот опыт невозможно полноценно передать в условиях текстового материала. Просто попробуйте сами! Установите Идрис и попробуйте постепенно построить все примеры из туториала, периодически оставляя «дырки» в коде и спрашивая компилятор, что он о них думает и как предлагает «латать».

Про нули

Ранее в объявлениях типов вы уже видели нули перед именами параметров, как здесь: 0 n' : Nat. Это и есть тот самый инструмент для квантификации пропозиций, о котором мы упоминали в самом начале статьи. Это отдельная обширная тема (практическое введение в нее можно получить из документации самого Идриса), которую мы не будем затрагивать в данном материале. Скажем только, что в тех местах, где вы видите аннотацию 0 перед именем параметра, Идрис будет применять механизм стирания, который гарантирует, что во время исполнения программы этих переменных не существует.

Ну то есть у нас есть функция — способность сделать заключение о неделимости некоторого отношения, но также и терм делимости следующего за ним. Очевидно нужно просто разобрать этот терм $proof\_next$ по образцу и положить аргумент его конструктора в функцию:

proofNextNotDivBy3 : Not (Divisible (S n') 3) -> Not (Divisible (S n' + 3) 3)
proofNextNotDivBy3 contr_curr (SelfDivisible _) impossible
proofNextNotDivBy3 contr_curr (NextDivisible curr) = contr_curr curr

Аналогично для… Так, стоп. Что за..

While processing left hand side of proofNextNotDivBy3. Can't solve constraint between: ?n' [no locals in scope] and ?_ [no locals in scope].

Нужно обозначить неявные параметры? Не вопрос, распишем все явно:

proofNextNotDivBy3 : (Divisible (S n') 3 -> Void) -> Divisible (S n' + 3) 3 -> Void
proofNextNotDivBy3 contr_curr (SelfDivisible _) impossible
proofNextNotDivBy3 contr_curr (NextDivisible {n'} {d' = 2} curr) = contr_curr curr

Хм.. Неявный параметр конструктора Идрис увидел, но с параметром контекста его не получается унифицировать:

While processing left hand side of proofNextNotDivBy3. Can't solve constraint between: ?n' [no locals in scope] and ?n' [no locals in scope].

Сделать еще более явно..?! Ну ok, давайте прямо покажем весь путь n':

proofNextNotDivBy3 : {n' : Nat} -> (Divisible (S n') 3 -> Void) -> Divisible (S n' + 3) 3 -> Void
proofNextNotDivBy3 {n'} contr_curr (SelfDivisible _) impossible
proofNextNotDivBy3 {n'} contr_curr (NextDivisible {n'} {d' = 2} curr) = (contr_curr curr)

Ага, параметры связались. Но теперь мы сломали паттерн‑матчинг:

While processing left hand side of proofNextNotDivBy3. Can't match on ?n' [no locals in scope] (Non linear pattern variable).

Очевидно что простое изменение имени параметра в контексте (с n' на что‑нибудь другое) ситуацию с нелинейностью не спасет. Ошибка в левой части определения функции... У меня плохое предчувствие, но ok, раз унификатор в сопоставлении с образцом не справляется, давайте «перенесем задачу» в правую часть определения:

proofNextNotDivBy3 : Not (Divisible (S n') 3) -> Not (Divisible (S n' + 3) 3)
proofNextNotDivBy3 contr_curr proof_next = case proof_next of
                                                (SelfDivisible _) impossible
                                                (NextDivisible curr) => contr_curr curr

Да твою дивизибл! Это еще что должно значить:

While processing right hand side of proofNextNotDivBy3. When unifying:

Divisible (S n') 3

and:

Divisible (S n') 3

Mismatch between: n' (implicitly bound at...) and n'.

После долгих попыток максимально ясно донести до компилятора свою мысль, мы вынуждены признать, что проблема, увы, глубока... Ее корни уходят в работу тайпчекера Идриса с АТД при зависимом паттерн‑матчинге. Все это выглядит как проблема экзистенциализации в GADT. Дело в том, что у нашего типа сложный индекс, вернее, мы делаем его сложным при объявлении типов функций proofNextNotDivBy, когда получаем в них выражения вроде $S\,n' + 3$ . Тайпчекеру приходится решать уравнения между выражениями индексов разных Divisible, чтобы унифицировать их, и constraint solver в процессе не справляется с этой задачей. Как я ни пытался, никакими сложными replace и rewrite, вынесением вспомогательных лемм, оборачиванием аргументов в лямбды и т. п., ничто не помогало избавиться от экзистенциализации типа индекса Divisible (которая в итоге приводит к неспособности унифицировать термы и получению загадочного Mismatch between: n' and n'). Только превращало код в plumbing, в котором терялся всякий смысл исходного намерения.

Вводим альтернативную спецификацию, показываем эквивалентность

В подобной ситуации программисты на Idris обычно делятся на два типа: тех, кто просто тихо матерится, и тех, у кого по лбу пробегает холодный пот. Но это если вы «нормальный программист» или пишете для работы. Если же вы ~~как и я~~ всей душой любите по ночам отлаживать абстрактный нонсенс, то бинго! Добро пожаловать в удивительный мир систем алгебраических уравнений на типах.

Но подождите! Мы же хотели сделать что‑то весьма простое. Почему мы вообще влезли в проблемы элиминации экзистенциалов GADT?! Или мы что‑то принципиально неправильно делаем?.. Давайте проверим нашу гипотезу. Если мы думаем, что проблема действительно именно в высокой сложности зависимого паттерн‑матчинга на наших Divisible, и возникает она из‑за получения сложных выражений в его индексах… Давайте сделаем вот что: наши делители в Divisible, т. е. знаменатели отношений, делимость которых мы моделируем, всегда остаются предельно просты — 3 или 5 — в них никогда не возникает каких‑то сложных выражений, так давайте на место индексов Divisible поставим их. То есть объявим Divisible как:

data Divisible : (denom : Nat) -> (numer : Nat) -> Type where

, чтобы в итоге получать функции вроде:

proofNextNotDivBy3 : Not (Divisible 3 (S n')) -> Not (Divisible 3 (3 + S n'))

Перепишем быстренько спецификацию и необходимые части нашего ФизБазза и увидим, что… оно работает. ?‍♂️

Какую пользу мы можем извлечь из этого приключения? Важно понять следующее: с использовании инструментария настолько мощного, как теорем‑пруверы или языки программирования на зависимых типах, важность сохранения осмысленности в коде выходит на новый уровень. Как мы говорили выше, теперь наши процедуры — это не просто какие‑то штуки для получения на экране компьютера желаемых эффектов малопонятным до конца образом (чаще всего наш инструментарий используют для программ, которые вообще не имеют ни ввода ни вывода). Это подлинные знания о чем‑то, об устройстве предмета нашего изучения. И чем более осмысленно (что вовсе не обязательно значит «просто»; но сложность кода, если она возникает, должна быть полезной — нетривиальные композиционные паттерны это одно, а тупой plumbing в попытках состыковать квадратное с круглым — совсем другое) устройство наших функций, тем большую ценность представляет код решения. Поэтому, очевидно, что в данном конкретном случае (для этого ФиззБазза) наиболее правильным решением было бы просто переписать спецификацию. Можно было вообще не упоминать все это приключение с proofNextNotDivBy в туториале, но после некоторых размышлений я решил оставить и его, и обе спецификации Divisible в коде. Зачем? Потому что это отличный повод продемонстрировать методы, которые можно применять для решения подобных проблем в более сложных проектах.

То есть давайте представим следующее: мы можем оказаться в ситуации, когда нам важно сохранить спецификацию (или ее часть) в определенном виде. Не просто по техническим причинам, а потому что именно эта ее форма имеет больше всего смысла для предметной области. И вот у нас возникает одновременно две проблемы:

нужно чисто технически согласовать разные спецификации между собой;
более фундаментальная проблема консистентности общей модели, состоящей из разных спецификаций.

В общем, если мы не хотим превратить наши доказательства в поток такого:

или, еще хуже, скатиться до использования believe_me в попытках с тайпчекером делать выводы через нерефлексивные эквиваленции (? Аристотель завещал в Идрисе использовать только самотождественность через Refl! Хотите, хм, более тонких эгалитарностей? Покупайте Книгу), или, наконец, получить корректную реализацию непонятно чего (из‑за неконсистентности в модели теории домена) — тогда придется включать голову.

Итак, мы хотим строгих формальных доказательств без unsafe постулатов, при этом чтобы они оперировали не abstract nonsense, а «нормальными» понятиями из теории домена, и при этом мы не хотим с нуля все переписывать на новую спецификацию… На помощь спешит (generalized abstract nonsense) теория категорий!

Что мы можем сказать о двух вариантах спецификации делимости, к которым мы пришли? Обе несут одинаковый смысл — что одно число нацело делится на другое, но выражение этого свойства у них несколько различается. В своем исходном виде Divisible говорит, что «numer делится denom'ом нацело», а после изменения — что «denom делит нацело numer». Суть отношения, очевидно, сохраняется. Но меняется некоторое направление действия, которым связаны объекты.

Чтобы убедиться, что мы нигде сами себе не противоречим и можем в разных частях модели (при переходах между доказательствами) использовать наиболее предпочтительное выражение Divisible, мы можем показать формальную эквивалентность данных спецификаций. В идеале — показать их изоморфизм. Но в строгом смысле это должно означать полную синтаксическую эквивалентность термов после применения композиции преобразований, то есть:

$(Divisible \circ Divisible')\,x\equiv\,x$

Настолько строго у нас здесь не получится. Ключевое различие между типами спецификаций — в валентности (ковариантности/контрвариантности) их индексов относительно конструкторов данных. Это напрямую влияет на то, как будет происходить индукция в доказательствах, использующих эти типы. И выше мы наблюдали ситуацию, в которой не самая удачная стратегия вывода может создать неудобства или проблемы. Поэтому в нашем случае, нам вполне достаточно будет семантической и пропозициональной эквивалентности, то есть чтобы наши спецификации обладали равной вычислительной силой и позволяли делать заключения об одних и тех же свойствах. Можно понимать это как слабый изоморфизм, или просто некоторую формальную гарантию того, что мы в доказательствах сможем оперировать композициями преобразований при переходах от одной спецификации к другой. Все это есть формализация теории предметной области (в нашем случае, делимости), на более сложных задачах и спецификациях это может быть необходимо осуществлять, чтобы иметь возможность работать со сложными моделями.

Попробуем заглянуть внутрь наших понятий. Если рассматривать наши типы как расслоения единого пространства $(Nat \times Nat)$ , то в исходном Divisible мы получим $id_{\mathfrak{D}} = SelfDivisible$ , а морфизмы NextDivisible будут: , а в новом типе: Введем категорию $\mathfrak{D}$ , в которой объектами являются предикаты делимости, а морфизмами — отношения порядка между ними на структуре слоя... Так, стоп, стоп! Уже слишком поздно, и у нас вообще-то практический туториал. Короче, нет времени объяснять: диаграммы категорий наверное коммутируют, значит, мы сможем показать эквивалентность.

Итак, альтернативная спецификация будет иметь вид:

data Divisible_Op : (denom : Nat) -> (numer : Nat) -> Type where
        SelfDivisible_Op : {x'     : Nat} -> Divisible_Op (S x') (S x')
        NextDivisible_Op : {d', n' : Nat} -> Divisible_Op (S d') (S n') -> Divisible_Op (S d') (S d' + S n')

Используя ее, мы, наконец можем построить необходимые логические переходы:

proofNextNotDivBy3_Op : Not (Divisible_Op 3 (S n')) -> Not (Divisible_Op 3 (3 + S n'))
proofNextNotDivBy3_Op contr_curr proof_next with (proof_next)
     _ | SelfDivisible_Op impossible
     _ | (NextDivisible_Op curr) = contr_curr curr

proofNextNotDivBy5_Op : Not (Divisible_Op 5 (S n')) -> Not (Divisible_Op 5 (5 + S n'))
proofNextNotDivBy5_Op contr_curr proof_next with (proof_next)
     _ | SelfDivisible_Op impossible
     _ | (NextDivisible_Op curr) = contr_curr curr

Теперь, собственно, пропозициональная эквивалентность. Мы можем достичь этого, показав, в духе HoTT, наличие путей между нашими объектами... ладно, молчу:

forwardEqDivisible : Divisible n d -> Divisible_Op d n
forwardEqDivisible SelfDivisible                   = SelfDivisible_Op
forwardEqDivisible (NextDivisible {n'} {d'} p)     =
   rewrite plusCommutative (S n') (S d') in NextDivisible_Op (forwardEqDivisible p)

backwardEqDivisible : Divisible_Op d n -> Divisible n d
backwardEqDivisible SelfDivisible_Op               = SelfDivisible
backwardEqDivisible (NextDivisible_Op {d'} {n'} p) =
   rewrite plusCommutative (S d') (S n') in NextDivisible (backwardEqDivisible p)

Можно было бы далее объединить спецификации единым интерфейсом, так как, по сути, они представляют собой различные представления (view). Но мы ограничимся тем, что реализуем логические переходы по исходной спецификации (которые используются в разрешающих процедурах) с помощью композиций преобразований, и на этом реализация логического модуля ФиззБазза будет завершена:

proofNextNotDivBy3 : Not (Divisible (S n') 3) -> Not (Divisible (S n' + 3) 3)
proofNextNotDivBy3 contr_curr proof_next =
     proofNextNotDivBy3_Op (contr_curr . backwardEqDivisible) proof_next_op where
          proof_next_op : Divisible_Op 3 (3 + S n')
          proof_next_op =
              rewrite (plusCommutative 3 (S n')) in (forwardEqDivisible proof_next)

proofNextNotDivBy5 : Not (Divisible (S n') 5) -> Not (Divisible (S n' + 5) 5)
proofNextNotDivBy5 contr_curr proof_next =
     proofNextNotDivBy5_Op (contr_curr . backwardEqDivisible) proof_next_op where
          proof_next_op : Divisible_Op 5 (5 + S n')
          proof_next_op =
              rewrite (plusCommutative 5 (S n')) in (forwardEqDivisible proof_next)

Строим программу. Верифицируем поведение

Итак, с основной логикой мы разобрались. Теперь напишем, собственно, саму игру. Давайте посмотрим на спецификацию процедуры игрового процесса:

playFizzBuzz : (first : Nat) -> (last : Nat) -> IO ()

Мы уже говорили, что это слишком размытая спецификация, она, по сути, никак не контролирует возможное устройство процесса. А какие гарантии мы хотели бы обеспечить для нашего ФиззБазза? Для начала, неплохо бы понимать, что наш процесс в принципе завершится. По условию задачи, мы должны пройти по некоторому диапазону чисел в определенном направлении. Чтобы процедура была завершимой, нам нужно гарантировать в этом движении конечное число шагов, то есть границы и направление должны быть определены корректно. Поэтому, если мы собираемся идти от начального числа до конечного по возрастанию, очевидно, мы должны потребовать, чтобы начальное число было меньше конечного или равно ему (тогда будем считать, что в игре мы должны сделать ровно один шаг):

playFizzBuzz : (first : Nat) -> (last : Nat) -> {auto p : LTE first last} -> IO ()

Мы вводим неявный параметр — терм типа $LTE\,first\,last$ , то есть доказательство свойства . Ключевое слово auto на неявном параметре — просьба компилятору Идриса попробовать найти значение аргумента самостоятельно. У такого поиска в Idris есть своя специфика и настраиваемые параметры (см. описание в документации), не будем в это сейчас подробно углубляться, скажем только, что мы здесь делаем это лишь для удобства: если Идрис сам найдет или построит необходимое доказательство — отлично, если у него не получится — ничего страшного, программист просто должен будет сам предоставить требуемый терм. С таким условием мы теперь можем попробовать построить процедуру игры. Покажем один из возможных вариантов, с использованием рекурсии:

playFizzBuzz : (first : Nat) -> (last : Nat) -> {auto p : LTE first last} -> IO ()
playFizzBuzz n last with (decEq n last)
     _ | Yes _       = do displayResult n; pure ()
     _ | No  notLast = do displayResult n;
                          playFizzBuzz (S n) last {p = proofNextLTELast} where
                          proofNextLTELast = case isLT n last of
                               Yes proofLT => proofLT
                               No  contrLT => let
                                              proofGTE = notLTImpliesGTE contrLT
                                              isLast   = antisymmetric p proofGTE
                                              in absurd (notLast isLast)

Здесь мы используем разрешимое сравнение decEq, чтобы проверить, должны ли мы идти вглубь рекурсии, или данный шаг игры будет последним. Сам паттерн процедуры достаточно простой, интереснее посмотреть на то, как мы строим доказательство, что мы не оказываемся за границами допустимого диапазона. Процедура изначально может быть запущена только с наличием терма $p: LTE\,first\,last$ , а при рекурсивном вызове на шаге мы должны предоставить новый $p: LTE\,(S\,n)\,last$ . Мы делаем это следующим образом: из результата decEq мы уже имеем терм , который утверждает, что n не равен last. Тогда мы осуществляем проверку isLT n last, которая разрешается либо в терм , который утверждает, что n строго меньше last, тогда из этого мы получаем исходно требуемое утверждение $(S\,n) ≤ last$ . Либо мы рассматриваем случай, что (после проверки isLT) n «вдруг оказался» больше или равен last (это следствие из ответа No нам показывает notLTImpliesGTE). Но тогда мы одновременно имеем два терма: изначальный утверждает, что , а утверждает, что .

Антисимметричность этих свойств дает нам утверждение, что n равен last. Мы пришли к противоречию с термом , с которого начинали рассуждение в данной ветви, что означает невозможность ситуации, которую мы рассматриваем. Технически, требуемый терм типа $LTE\,(S\,n)\,last$ мы здесь получаем согласно принципу «Ex falso quodlibet», что реализует функция absurd: она требует терм ненаселяемого типа, а выдает все, что пожелаешь. Это как бы такой функциональный аналог impossible, только impossible снимает необходимость самого определения, а absurd освобождает от необходимости завершить доказательство, когда мы уже находимся в процессе определения.

Выглядит как вполне корректная, всегда завершающаяся процедура. Однако, чтобы убедиться в этом, включим в самом начале нашей программы директиву %default total, и Идрис нам отвечает, что…

playFizzBuzz is not total, possibly not terminating due to call to Main.with block in playFizzBuzz;

with block in playFizzBuzz is not total, possibly not terminating due to recursive path Main.playFizzBuzz → Main.with block in playFizzBuzz → Main.playFizzBuzz → Main.with block in playFizzBuzz

Проверка тотальности в Идрисе

необходимо консервативна (в силу неразрешимости проблемы остановки), это значит, что при использовании, она должна гарантированно запрещать признать тотальной не завершающуюся на всех входах функцию, однако, она может иногда не признавать на самом деле тотальную функцию таковой. Возможные причины этого «иногда» следуют из набора правил проверки тотальности (если функция не демонстрирует свойств, установленных правилами, ее могут не признать тотальной). Сама по себе эта ситуация абсолютно нормальна. Увы, по‑настоящему печально другое — известно, что на данный момент сама реализация проверки тотальности в Идрисе не идеальна, проще говоря, она может ошибаться и признавать нетотальные функции тотальными... Что ж, будем искренне надеяться на скорейшее исправление ситуации (о других ограничениях инструмента мы еще скажем в конце туториала) в новых релизах. Пока же мы можем только принять ситуацию.

В рамках установленных правил, Идрис не признает функцию тотальной, так как по ходу рекурсивных вызовов у нас не уменьшается ни один аргумент, и вся цепочка не сводится явно к некоторой базе с нулем, иначе говоря, наша рекурсия не well‑founded. Очевидно, что это дело техники — переписать процедуру так, чтобы структурно получить определения для случаев и $(S\,k)$ по параметру рекурсии. Попробуйте самостоятельно сделать это каким‑нибудь способом, который вам больше нравится (но сохранив спецификацию в виде границ first и last, и с условием прохождения проверки тотальности). Мы же сейчас пойдем дальше, и усилим спецификацию игровой процедуры в целом.

Если мы хотим действительно верифицированный процесс, то очевидно, что одной гарантии его завершимости недостаточно. Нам нужна более продуманная спецификация того, как именно происходит ФиззБазз с точки зрения игрового процесса. Давайте рассмотрим такую процедуру:

calcFizzBuzz : (first : Nat) ->
               (last  : Nat) ->
               {auto 0 p : LTE first last} ->
               Vect (S (last `minus` first)) (n ** GameState n)

Теперь это процедура, которая только вычисляет игру. Она возвращает вектор, содержащий необходимое количество шагов считалки, которые представляются типом n ** GameState n. До этого в туториале мы видели множество примеров одного вида зависимых типов — зависимых функций. Тип элементов вектора‑результата calcFizzBuzz — это другой вид зависимых типов: зависимая пара. Это так называемый «сигма‑тип», который выражает квантор существования: в зависимой паре тип ее второго элемента зависит от значения первого, что в предикатной логике соответствует утверждению «существует такое значение [первый элемент пары], что некоторое свойство [второй элемент] истинно». Для нас это означает, что мы построим вектор, состоящий из пар число‑вопрос ** ответ считалки. Это позволит нам показывать определенные свойства процесса игры, который мы строим.

Вот определение:

calcFizzBuzz : (first : Nat) ->
               (last  : Nat) ->
               {auto 0 p : LTE first last} ->
               Vect (S (last `minus` first)) (n ** GameState n)
calcFizzBuzz first last = map (\n => (n ** gameLogic n)) (vectNatFromTo first last)

То есть мы строим вектор чисел‑вопросов и отображаем на него функцию, связывающую числа с вычисляемыми на них ответами ФиззБазза. Такой вид результата позволит доказать, что все необходимые числа были посчитаны. Также возможно будет доказать корректный порядок ответов. Но эти доказательства мы оставим за рамками данного туториала.

Сама же функция vectNatFromTo и представляет собой процесс прохода по считалке:

vectNatFromTo : (start : Nat) ->
                (end   : Nat) ->
                {auto 0 p : LTE start end} ->
                Vect (S (end `minus` start)) Nat
vectNatFromTo start end = go start (end `minus` start) where
                          go : (cur : Nat) -> (steps : Nat) -> Vect (S steps) Nat
                          go cur Z     = [cur]
                          go cur (S k) = cur :: go (S cur) k

В целях оптимизации, можно было бы сделать этот процесс прохода ленивым (поскольку calcFizzBuzz — просто отображение логики игры на этот процесс). Вот теперь мы получили осмысленную модель процесса: строим процесс ходов в игре и отображаем на него игровую логику. Обе функции проходят проверку тотальности.

Что же, осталось явить наш ФиззБазз миру:

writeFizzBuzz : Vect (S l) (n ** GameState n) -> String
writeFizzBuzz Nil impossible
writeFizzBuzz states = foldr writer "" states where
                             writer : (n ** GameState n) -> String -> String
                             writer (num ** state) next = let line = 
                               [padLeft 5 ' ' (show num), " => ", show state, "\n"]
                                                          in joinBy "" line ++ next

Это одна из возможных реализаций. Добавим только, что, при желании, ее тоже можно верифицировать (специфицировать вывод и доказать соответствие ему получаемых результатов), оптимизировать, и более гибко настроить! Главное, что мы сейчас показали — четкое разделение всей программы на:

игровую логику
игровой процесс (проход по считалке + вычисление ответов)
формирование результата
наконец, передача результата во «внешний мир» (вместе со сборкой всех этапов в единое целое)

Последний шаг выглядит следующим образом:

main : IO ()
main = putStrLn (writeFizzBuzz (calcFizzBuzz 1 100))

Попробуйте запустить игру в неправильном направлении:

main = putStrLn (writeFizzBuzz (calcFizzBuzz 100 1))

Компилятор такое не пропустит:

While processing right hand side of main. Can't find an implementation for LTE 100 1.

Если захотите исследовать далекие состояния считалки, рекомендуется явно передавать терм доказательства, чтобы не мучить компилятор:

main = putStrLn (writeFizzBuzz (calcFizzBuzz 1090901 1091001
                               {p = lteReflectsLTE 1090901 1091001 Refl}))

Подведем небольшие итоги. Мы добились того, что наша программа:

строго специфицирует задачу (и позволяет настраивать эту спецификацию)
гарантирует отсутствие состояний с неверной логикой игры
гарантирует завершающийся процесс и некоторые его свойства (правильные границы игры и направление прохода по ней; как уже было сказано, эту часть можно усилить, показав необходимые инварианты относительно чисел-вопросов и результатов-ответов)

Необходимо упомянуть о некоторых ограничениях, которые пока присутствуют в Idris 2 (помимо уже упомянутой выше проблемы с totality checker):

rewrite не работает на зависимых типах. Это объясняет, почему у нас не получалось помочь тайпчекеру унифицировать термы при реализации процедур proofNextNotDivBy
в настоящий момент система типов Idris 2 не реализует принцип кумулятивности. Да, мы все это время работали в системе, в которой . Что кагбэ намекаэ...

Звучит как ФиззБазз. Если вы дочитали этот пост до конца, поздравляю, вы прошли посвящение в Орден Оверинжиниринга Программ! Да-да, именно про него, равно как и про ФиззБазз и TDD (вы знаете, которое), обязательно спрашивают в наше время на любом собеседовании в программисты.

А если серьезно, то в завершение хотелось бы сказать следующее. Производительность? Простота, читаемость? Расширяемость? Безусловно, важны. Но есть ли во всем этом смысл, если программа делает не то, что нужно? Современная разработка нуждается в сдвиге парадигмы: на первое место должна выйти доказуемая корректность программного обеспечения — способность гарантировать, что наш код исполняет именно то, что мы от него ожидаем. И речь идет о самой широкой практике, а не о каких-то особенных специальных областях «где это необходимо». Сколько можно гадать, когда настанет тот день, где мы вместо ожидаемого вывода увидим окошко с красным крестом, или того хуже, белую эпитафию на синем экране? Зачем нужны тысячи приложений с разным дизайном, если среди них нет ни одного абсолютно надежного? Перестаньте доверять и проверять. Начните доказывать.

Всех с днем программиста! Интересной и осмысленной вам разработки. Спасибо за внимание, Хабр, удачи и до новых встреч!

Код туториала на GitHub

Комментарии (0)

Dhwtj
13.09.2025 21:47
#28833500
Давайте напишем что такое и успокоимся

А из статьи я ничего не понял
```
module FizzBuzzProof
%default total  -- Все функции должны быть тотальными (без дыр и расходимостей)

-- Тип-предикат: "n делится на k"
-- Это не Bool, а Type! Значение этого типа = доказательство делимости
DivBy : Int -> Int -> Type
DivBy k n = (n `mod` k = 0)  -- Равенство как тип-пропозиция

-- Алгебраический тип данных, описывающий ВСЕ возможные случаи FizzBuzz
-- Каждый конструктор требует ДОКАЗАТЕЛЬСТВА своего случая
data FBCase : (n : Int) -> Type where
  -- n делится и на 3, и на 5 → нужны оба доказательства
  IsFizzBuzz : DivBy 3 n -> DivBy 5 n -> FBCase n

  -- n делится на 3, но НЕ на 5 → доказательство делимости + доказательство НЕделимости
  IsFizzOnly : DivBy 3 n -> Not (DivBy 5 n) -> FBCase n

  -- n делится на 5, но НЕ на 3
  IsBuzzOnly : DivBy 5 n -> Not (DivBy 3 n) -> FBCase n

  -- n не делится ни на 3, ни на 5 → два доказательства отрицания
  IsNumber   : Not (DivBy 3 n) -> Not (DivBy 5 n) -> FBCase n

-- Решаем делимость: для любых k и n возвращаем либо Yes с доказательством,
-- либо No с доказательством невозможности
-- Dec = Decidable, стандартный тип для разрешимых предикатов
decDivBy : (k : Int) -> (n : Int) -> Dec (DivBy k n)
decDivBy k n with (decEq (n `mod` k) 0)  -- decEq решает равенство
  | Yes prf = Yes prf    -- prf : (n `mod` k = 0), это и есть DivBy k n
  | No ne   = No (\pf => ne pf)  -- ne : (n `mod` k = 0) -> Void
                                  -- строим: DivBy k n -> Void

-- Классификация: для ЛЮБОГО n строим корректный FBCase n
-- Компилятор проверяет, что мы покрыли ВСЕ комбинации Yes/No
classify : (n : Int) -> FBCase n
classify n with (decDivBy 3 n)      -- Сначала проверяем делимость на 3
  | Yes pf3 with (decDivBy 5 n)     -- Если делится на 3, проверяем на 5
    | Yes pf5 = IsFizzBuzz pf3 pf5  -- Делится на оба → FizzBuzz
    | No  n5  = IsFizzOnly pf3 n5   -- Только на 3 → Fizz
  | No  n3  with (decDivBy 5 n)     -- Если НЕ делится на 3, проверяем на 5
    | Yes pf5 = IsBuzzOnly pf5 n3   -- Только на 5 → Buzz
    | No  n5  = IsNumber n3 n5      -- Ни на что → число

-- Рендер ГАРАНТИРОВАННО согласован со спецификацией
-- Паттерн-матчинг на FBCase n извлекает доказательства (хотя мы их не используем)
render : (n : Int) -> FBCase n -> String
render n (IsFizzBuzz _ _) = "FizzBuzz"  -- _ = неиспользуемые доказательства
render n (IsFizzOnly _ _) = "Fizz"
render n (IsBuzzOnly _ _) = "Buzz"
render n (IsNumber _ _)   = show n

-- Финальная функция: классифицируем и рендерим
-- НЕВОЗМОЖНО вернуть неправильную строку для данного n
fizzbuzz : Int -> String
fizzbuzz n = render n (classify n)

-- Пример использования с IO (не тотальная из-за рекурсии)
partial
loop : Int -> Int -> IO ()
loop n m =
  if n > m then pure ()
  else do
    putStrLn (fizzbuzz n)
    loop (n + 1) m

main : IO ()
main = loop 1 100
```
Dec как машина доказательств: Dec — это "решаемое утверждение". Для любого n мы можем за конечное время решить, делится ли оно на k.

Доказательства стираются: В рантайме доказательства (DivBy, Not) исчезают — остаётся обычный эффективный код. Но на этапе компиляции они гарантируют корректность
1. LaRN
  13.09.2025 21:47
  #28835366
  Хм, а почему мы верим что в компиляторе нет ошибки? Он тоже скомпилен из кода на этом языке?
  1. knight_of_calculus Автор
    13.09.2025 21:47
    #28840782
    От себя отвечу, что верификация самих компиляторов — одна из наиболее востребованных областей в плане применения формальных методов (задача — гарантировать, что скомпилированный код семантически эквивалентен исходному). Можно почитать, например, про проект CompCert.
    
    И да — Idris 2 написан на Idris 2! Но насчет ошибок и имеющихся недостатков мы говорили в статье
1. knight_of_calculus Автор
  13.09.2025 21:47
  #28839460
  Здравствуйте, спасибо за комментарий. Я согласен с тем, что ключевой вопрос — «где успокоиться?» Например, в Вашем решении возможны высказывания loop100 1, loop1 -100 и т. п. Но имеют ли они смысл? В статье мы показываем, как можно на разных уровнях ограничить область допустимых высказываний так, чтобы невалидные состояния были непредставимы («make illegal states unrepresentable»). Вы валидируете состояние проверкой ifn > mthen, но технически программа в нем оказывается. Разумеется, с точки зрения данного конкретного кода у Вас все хорошо, но представим, что мы делаем не учебный ФиззБазз, а пишем библиотеку для работы в некоторой предметной области. Ее пользователь может уже в своем решении где‑то использовать неосмысленное высказывание, Ваша библиотека закроет на это глаза, а дальше.. зависит от совпадения корректности реализации конкретного случая и «уместности» использования такого высказывания. Просто молчаливое игнорирование — это корректно или нет? В статье мы хотели показать, что если некоторый (конечно, недостижимый) предел — абсолютное исключение необходимости эмпирического тестирования (а также доверия к нестрого формализованным свойствам), то мы должны идти глубже — на уровень формализации самой предметной области и верификации ее высказываний (все в ней: базовые определения, процессы etc).
  
  Ключевое отличие Вашего решения — в моделировании самого понятия делимости. Вы пишете, что «число делимо нацело на другое, если остаток от деления равен нулю». Мы же используем более аксиоматизированный подход, мы вводим два явных, фундаментальных положения: а) «число делимо нацело само на себя»; б) «если делимо нацело на , то делимо нацело на ». Обратите внимание, мы нигде не упоминаем и не используем процедуру деления! То есть наши спецификации различаются с точки зрения модели (теории) предметной области. Опять же, можно рассматривать это сугубо как вопрос «где успокоиться». Да, Ваша проверка (разрешение делимости) тоже осуществляется на уровне типов (через метод `mod` интерфейса Integral, но его корни ведут куда‑то к prim__mod_Integer, а это что такое с т.з. теории? Почему мы вообще оперируем Int?), но ее результатом (и доказательством в случае делимости) будет утверждение относительно равенства остатка от деления Integer на Integer нулю, «конечный» Refl в типе‑пропозиции свойства DivBy (полученный через оперирование понятиями Integer и prim__mod_Integer, Вы им «делегировали» формализацию нашей теории). А результатом нашего подхода будет «весь путь по введенным базовым понятиям предметной области целиком» (цепочка конструкторов‑предикатов делимости Divisible). В некоторых случаях данная информация сама по себе и может представлять конечную цель и ценность — если мы ищем решение некоторой задачи в терминах ее предметной области.
  
  Ну или, короче, можно сказать что наши решения извлекают разные знания. Что именно мы хотим понять и насколько глубоко... Вероятно, это тоже вопрос «где успокоиться».
  1. Dhwtj
    13.09.2025 21:47
    #28839920
    Хотелось бы полный код с комментариями. Потому что статью прочитать трудно. Хоть из кода что-то пойму, наверное
    
    knight_of_calculus Автор
    13.09.2025 21:47
    #28840772
    Так есть же код, целых две ссылки было в статье :) Вот, держите: https://github.com/knight‑of‑calculus/total_fizzbuzz
    
    По ходу листинга там комментариев нет, но, думаю, Вы разберетесь (если что, пишите, буду рад обсудить разные моменты). Может быть немного позднее добавлю краткие пояснения и на ГитХабе. А так, туториал и представляет собой в т.ч. и большой развернутый комментарий решения

Megadeth77
13.09.2025 21:47
#28835576
За статью спасибо, познавательно, некоторые (мало) слова понял, но выглядит это как попытки забивать гвозди микроскопом. Если для чего и нужны такие интеллектуальные экзерсисы так это точно не для написания типового круда. Для чего - конечно было бы любопытно узнать, начало то было многообещающее - мол от программ часто зависят финансы и даже жизнь, есть хоть один пример, где подобное что либо из ужасного предотвратило? Надеялся, что Вы, как представитель страховой компании, приведете примеры. В плане пофилософствовать - создание программы - это управление сложностью, т.е. типовой круд бесконечно сложен (непознаваем), если его с математической точки зрения оценивать на корректность, а обычные яп эту сложность сводят к компромиссу между ограниченно проверяемой корректностью и возможностью реализовать, не отправив команду в компанию к наполеонам и мертвым продуктам питания.
1. knight_of_calculus Автор
  13.09.2025 21:47
  #28840724
  Спасибо за комментарий. На самом деле, Вы поднимаете очень важный вопрос, поэтому здесь хочется дать развернутый ответ. По поводу «забивать гвозди микроскопом»: я убежден, что именно инструменты, которые мы используем, формируют наше мышление. Если у нас в руках молоток, то тогда мы видим гвозди. А если у нас микроскоп (или телескоп) — мы совершенно иначе смотрим на проблему. В сегодняшней практике программной инженерии очень прижилось убеждение, что «для любой задачи нужен правильный инструмент». Локально, для конкретных случаев, это верно, но в пределе это приводит к убеждению, будто для каждой задачи уже сейчас существует (единственно) правильный инструмент. А какой инструмент по‑настоящему правильный? И исходя из чего мы назначили таковым что‑то конкретное сейчас? Поскольку мы чаще всего ограничены набором конкретных (неидеальных) инструментов, в нас поселяется привычка, что «правильно — это то, что чаще всего используется в подобной ситуации».
  
  «Типовой круд» — для меня и есть наиболее яркий пример того, как все просто привыкли к ситуации: к багам, ошибкам, сбоям, как к норме, потому что приоритетом инструментария, который используется в типовом круде никогда не была корректность. То есть большинство инструментов как бы говорят тебе: «ты можешь сделать просто и быстро, если заморочишься — можешь сделать эффективно, гибко, производительно, расширяемо... но ты не можешь сделать абсолютно правильно». А ведь именно здесь — поле для наиболее эффективной оптимизации: тонны типового круда выиграют от того, если один раз мы решаем задачу абсолютно правильно, а уже потом от нее оптимизируем, расширяем и т. д. по потребностям (доказывая или не доказывая, если не требуется, корректность модификаций). Учебные примеры в первой главе статьи: достать элемент из списка, вставить/удалить/соединить без ошибок и т. д. — на этом же и держится весь «типовой круд». В ситуации, когда перед Вами есть а) абсолютно корректное, надежное (но, например, медленное) решение и б) супер‑быстрое, но не верифицированное — Вы можете выбирать. И, думаю, многие согласились бы, что разумно за базу принять корректность. Рядовым же разработчикам, а в итоге просто обыкновенным пользователям сегодня выбирать, как привило, не приходится — вот тебе миллион вариантов приложений для одной и той же задачи (письмо написать, пиццу заказать, такси вызвать и т. д., а в итоге — весь органайзер/кабинет/дела и жизнь современного человека внутри его ноутбука или смартфона): есть такие, сякие, красные, желтые, зеленые, но только надежного и без ошибок — нет.
  
  Скажем, если «чистые» теорем‑пруверы это действительно такой абсолютный «телескоп», на который взять и положить типовой повседневный круд непросто, то вся прелесть инструментария вроде Idris именно в том, что он дает в руки и телескоп, и микроскоп, и ~~молоток~~ обыкновенные очки. И «на передовой» программирования это уже сегодня общий тренд — и Lean, и Rocq, уже все позиционируют себя не только как системы доказательства теорем в чистой математике, но и как языки программирования широкого назначения. С «другой стороны» к этому же движутся промышленные языки программирования, хотя и медленно.
  
  Теперь про примеры. Тут надо начать с того, что вопрос про «пример, где подобное что‑либо из ужасного предотвратило» содержит в себе логическое противоречие :) Оно ведь либо предотвратило, либо.. «вот вам пример». Поэтому, если говорить о прямо вот конкретных кейсах, то мы можем, увы, приводить печальные примеры того, когда не предотвратило (вероятнее всего потому, что не использовалось). Возможно, Вы слышали про печальные случаи с рентгеновским и лучевым медицинским оборудованием. Другой известный случай, когда весь Интернет лег из‑за nullPointerException (или чего‑то подобного), был совсем недавно. Обратите внимание на озвучиваемые причины и выводы из ситуации:
  
  некорректное обновление вышло раньше, чем его смогли отловить тесты
  
  так бывает, когда на прод попадает не до конца протестированный релиз
  
  Но правда в том, что так всегда будет, пока наш основной или единственный способ обеспечения корректности это тестирование. «Типичный круд» или жизненно важная система — природа ошибок часто одинаковая. То есть программирование, на самом деле, не делится на «гвозди, которым нужен молоток» и что‑то другое, «особенное». Скорее на оптику, которой мы рассматриваем проблему. Если рассматривать программирование как инженерию — то это особый вид инженерии, который имеет дело с идеальными компонентами для построения сложных систем, лишенными допусков и ограничений физической природы (в отличие от материальной базы в электротехнике, например). Единственные ограничения, с которыми работает программист — это ограничения разума.
  
  Так что, если говорить о примерах разной «цены ошибки» из введения к статье — то вот они. Но можно, все же, привести и примеры «где предотвратило». Вот, например, опять же из относительно недавнего. Там в сообщении акцент, конечно, сделан на другое, что мол это ИИ нашел самостоятельно. Но на самом деле это и есть пример того, когда формальные методы выявляют то, что не обнаруживалось никаким тестированием (ИИ или не ИИ разработал решающую формальную спецификацию, в данном отношении не важно). Просто понятно, что здесь это «предотвратило» такое ненастоящее, эта ошибка все время там жила на проде, просто не давала о себе знать, и не успела дождаться своего часа. А примеры «настоящего предотвратило» — мы их никогда не увидим, и слава богу. Настоящее предотвращение происходит в процессе разработки верифицированных систем, а потом, когда эти системы работают, все просто не думают об этом и радуются жизни, как и должно быть. Каждый долетевший самолет (DO-178C прямо требует применения строгих методов верификации и валидации ПО для различных уровней критичности от A до E) и доехавший автомобиль (ISO 26262 прямо рекомендует, а для высших уровней целостности безопасности (ASIL C и D) — требует применения формальных методов верификации ПО) — вот примеры предотвращенных формальными методами ошибок.
  
  Просто чуть более, чем всегда, когда разговоры заходят на тему важности корректности ПО и «оправданности» формальных методов, приводят именно такие примеры: область safety‑critical software (авиация и ядерные реакторы). Ну и еще криптография, ИБ, компиляторостроение. А «обыкновенный» софт, которым каждый день пользуются миллионы людей, чем хуже? Чем принципиально отличается? Начинать нужно с малого. Сегодня — верифицированная сортировка вставками в проекте/библиотеке одного разработчика, а завтра все смартфоны и ноутбуки планеты работают идеально без сбоев веками. Это возможный сценарий, а его реалистичность зависит от нашего желания.
  
  Ну а пока мы все с интересом ждем 19 января 2038 года :)

ФиззБазз ΟΕΔ. Практическое введение в формальную верификацию на зависимых типах Idris 2 +26

Введение в Idris, зависимые типы и процесс Type-Driven Development

Специфицируем задачу

Пишем решение. Доказываем корректность логики

Вводим альтернативную спецификацию, показываем эквивалентность

Строим программу. Верифицируем поведение

Комментарии (0)

Dhwtj

LaRN

knight_of_calculus Автор

knight_of_calculus Автор

Dhwtj

knight_of_calculus Автор

Megadeth77

knight_of_calculus Автор