Вы знали, что ниша антиплагиата пухнет от денег? Я тоже не знал, пока не полез в тендеры и мировую статистику. К 2030 году мировой объем долетит до $5.9 млрд. Но на рынке творится какой-то абсурд.
Рынок российского антиплагиата — 1,5 милларда рублей. Официальной статистики вы не найдёте. Эту информацию я нашёл сам в тендерах и базе СПАРК. И эти деньги тратят на проверку «технической» уникальности.
В 2020 году можно было парсить шинглы, с чистой совестью продавать это ВУЗам и знать, что почти наверняка программа поймает всех плагиатчиков. Сейчас картина немного другая:
24% студенческих работ содержат четкие следы ИИ. Это рост в четыре раза по сравнению с 2023.
43% студентов сами признаются, что отдают нейросетям написание рефератов и дипломов.
При этом самая популярная система антиплагиата, по словам директора компании, в начале года ловила на ИИ лишь 15% работ. А с недавних пор начала «ловить» ИИ даже там, где его не было: 1, 2. Это всё уже привлекло внимание представителей ЛДПР и Мизулиной.

Как распределяются деньги на рынке антиплагиата
Судя по тому, что нашёл я, разделение примерно следующее.
Вузы и госсектор — 80%. Министерства заставляют университет сканировать студенческие работы, а вузы покупают софт «для галочки». Средний федеральный университет тратит порядка 2 млн рублей за год.
Студенты — 15%. Они платят 200–300 рублей за прогон файла, чтобы проверить базовую уникальность.
Энтерпрайз — 5%. Крупный бизнес и НИИ смотрят, нет ли у них какого украденного кода или использования чужих патентов. В науке и больших производствах крайне важно не нарушить ничьи права.
Получается, что львиную долю бюджетов генерирует государство. И когда есть устоявшийся подход, сменить его трудно — поэтому ВУЗы закупают всё те же системы, что и пять лет назад.
За что платят миллионы
Профильные тендеры стабильно забирают три класса систем.
Масс-маркет с устаревшими технологиями. Он ловит откровенную копипасту и ленивые решения. Там честно работают отсев шинглов и стопроцентных дублей. Но нейросети ломают эту защиту в один клик. Студентам даже платная подписка не нужна, чтобы обходить такие фильтры.
Энтерпрайз-тяжеловесы. Серьезные продукты для НИИ и крупного бизнеса, которые я упоминал выше. Такие модели хорошо работают. Они анализируют векторную семантику. Скрипт парсит смысл текста, а не отдельные слова. Казалось бы, здорово? С точки зрения результата — да.
Только вот внедрять такие платформы и пользоваться ими — отдельная большая задача, с которой справляются только корпораты. Нужны и свои сервера, и IT-отдел, и небольшое обучение для пользователей — всё-таки там не только кнопка «проверить». Но бизнес и НИИ замотивированы всем этим пользоваться — для них это сейчас единственный рабочий способ не пустить в продакшен сгенерированный шлак.
Чего-то «среднего» нет — либо покупаете дешёвую систему, которая даёт слабые результаты, либо вкладываетесь в энтерпрайз.
Turnitin. Это американский стандарт, который вроде бы решает все проблемы. И все новые технологии использованы, и айтишникам его внедрять проще, и пользователям легко.
Только вот легально купить лицензию нельзя, Turnitin поставлют через пень-колоду. И главное — зарубежный софт абсолютно слеп к сложной морфологии русского языка, отчего часто выдаёт ложноположительные срабатывания (об этом я подробнее расскажу в следующих статьях).
Как итог — по-настоящему удобного решения нет и пока не предвидится. Везде приходится сталкиваться с мощными ограничениями. Ругать рынок бессмысленно — сделать ситуацию лучше прямо сейчас вряд ли получится.
Как LLM ломают рынок прямо сейчас
Старые системы ищут точную копипасту, но любой «шаристый» студент берёт базовую бесплатную LLM и ломает алгоритм:
Кто-то прогоняет фрагменты через каскад переводчиков вроде DeepL. Русский → английский → французский → английский → русский. Смысл сохраняется, но сами слова и предложения меняются полностью.
Кто-то заставляет нейросеть полностью пересобрать текст хитрыми промптами.
Кто-то меняет базу терминов синонимами.
Старые скрипты стали бессильны. В ответ вендоры выкатили новые ИТ-костыли. Разработчики прикрутили модули AI-детекции.
В попытке адаптироваться к ИИ технологии пришли к массовым ложно-положительным срабатываниям. Скрипты сходят с ума, когда проверяют работы. Они игнорируют на контекст и то, что перед ними студенческие работы. Софт видит сложный академический слог и сразу кричит: «нейросеть!». А что студенты обязаны писать таким слогом — ну, это уже другой вопрос.
В итоге системы антиплагиата не помогают отсеивать плагиатчиков, а заставляют студентов и преподавателей совместно переписывать реальные работы, чтобы программа не обвинила их в использовании ИИ.
Что будет с рынком? Расскажу в следующих частях
Пока рынок заливает проблему деньгами, студенты продолжают обходить алгоритмы за пару кликов. В ближайшее время я залезу в эти системы и покажу, как работал антиплагиат раньше, на чем конкретно ломаются старые алгоритмы сейчас, и что может спасти от засилья ИИ-генерации. А потом, может, и какой прогноз соображу.
Комментарии (7)

babvrby
11.05.2026 09:33Может я чего-то не понял, но о каком плагиате может идти речь, если человек использовал для подготовки своей позиции LLM? ИИ у нас что уже имеет авторские права? Он же всего лишь инструмент, об этом вам каждая модель расскажет. На мой взгляд, речь может идти в данном случае только о качестве работы. Если с качеством все в порядке. это значит, что автор правильно поставил задачи ИИ, он же, черт побери инструмент и должен исполнять волю разумного существа. Уж либо надо признавать, что все эти LLM разумные существа, либо радоваться тому, что студенты учатся пользоваться современным инструментарием и поощрять их за это.

alexhu
11.05.2026 09:33Государство и бизнес тратят 1,5 миллиарда в год на слепой антиплагиат — и это проблема
Почему это проблема? И для кого это проблема?
Преподаватели прекрасно осознают, что 99 % абитуриентов полностью полагаются на ИИ, половина школьников старших классов не знает таблицу умножения, большая часть выпускников не понимают какой специальности их учили.
Ну прогнали текст через антиплагиат, всё равно все защитятся и выпустятся. В чём состоит проблема?

Radisto
11.05.2026 09:33Знал студента, который переписал описательную часть диплома своими словами (вариант от ии был с малым процентом оригинальности) и оригинальность стала ещё ниже по оценке автоматического антиплагиата. То есть существующие решения не только не поощряют использование ии, но и вынуждают его использовать: кожаные технари не настолько хороши в конструировании наборов слов из корпуса русского языка, в техвузах от них другого ждут
AndruxaBS
Ну я понимаю практическую часть самому сделать. Но какой студент в здравом уме будет писать бумажки и документацию, если можно где то стащить, а теперь и сгенерить.
ss-pol
Давайте начистоту. Цель ВУЗа - подготовить специалиста, способного решать поставленные задачи в заданной области, отфильтровать неспособных. Какая разница при этом, как именно эта задача будет решена, с помощью неройнки или без, если на работе будут те же самые условия. С этой точки зрения копирование части работы из доступных источников не страшно, если такое же будет допустимо и на рабочем месте. Тогда в чём же проблема? Надо создать схожие условия по использованию нейронок, как и на рабочем месте.
Кто-то скажет, но ведь есть действительно умные талантливые трудолюбивые ребята, которые при таком подходе оказываются ничем не лучше бездельника, который научился ловко составлять промпт. А я отвечу - а какая разница, если на рабочем месте будет то же самое? Или разница всё-таки есть? Тогда надо определиться в чём она и создать соответствующие условия.
Int_13h
А зарплату промпто-составителю можно платить меньше, или он столько же захочет, сколько и кустарь с ручным трудом? Но тогда он должен раз в, допустим, 10 эффективнее работать благодаря автоматизации, значит на него можно за ту же зарплату повесить раз в 10 больше обязанностей? Автоматизация труда, в том числе и с помощью ИИ, должна приносить ощутимый профит - либо сэкономить на персонале, либо штамповать продукцию как из пулемета.
AndruxaBS
Полностью согласен! Т.е. можно оставить какое то небольшое кол-во топовых университетов, которые будут готовить имено будущих научных специалистов. Остальным же прекратить этот бесячий косплей подготовки начинающих ученных и прочую развивайку, сосредоточившись непосредственно на прикладной области и тем чем человек конкретно будет заниматься в трудовой деятельности.