Привет, Хабр! Недавно мы запустили Wunder RNN Challenge — соревнование по машинному обучению, где нужно предсказывать следующее состояние рынка по последовательности предыдущих состояний.

В этом посте мы расскажем, что это за состояние рынка, и в чём вообще прикол.

Решения принимаются до 1 декабря
Призовой фонд $13,600

О доменной области

Мы в Wunder Fund занимаемся высокочастотным алготрейдингом, задача для соревнования оттуда и взялась. Будет чуть-чуть издалека, но постараюсь коротко, какие-то вещи буду опускать.

Вот есть биржа, там люди торгуют валютами, акциями, фьючерсами и т.д. Кто-то хочет купить, кто-то продать, все они отправляют на биржу ордера (заявки) с ценами и объёмами. Биржа эти заявки сводит в сделки, а если не с кем сделать сделку, то заявка остаётся висеть в ордербуке (стакане).

? Как это часто бывает, правила у игры простые, но в итоге из них получается довольно сложное и интересное поведение участников в отдельности и системы в целом.

О торговле

Участники торгов генерят большое число событий, биржа рассылает апдейты всем подписавшимся. Участников много, инструментов много, событий много — данных получается тоже много.

Есть разные способы думать о торговле, разные подходы и фреймворки. Можно попробовать построить модель, которая после каждого апдейта сообщает вам ваше оптимальное действие из набора {продать Х, купить Х, ничего не делать}. Или сообщает вам, где модель хочет, чтобы стояли ваши ордера. Или какие позиции по каким инструментам она хочет иметь.

В любом случае в каждом из подходов есть элемент предсказания будущего, иногда на доли секунд, иногда на более долгий срок. Некоторые люди говорят, что там шум, вы предсказываете случайное блуждание, рынок эффективен и т.д. — оставим их наедине с их печалью.


Соревнование, данные, состояние рынка

Мы можем описать текущее состояние каждого ордербука (стакана) некоторым вектором параметров. То же — для набора из нескольких ордербуков. То же — для недавней истории активности в них: добавления, удаления ордеров, случившиеся сделки и прочее. Будем итоговый вектор называть «состоянием рынка».

Что включать в этот вектор, какие фичи полезны — это отдельная наука, туда можно вложить довольно много ума и усилий. В рамках задачи челленджа мы этого вопроса не касаемся. Мы взяли некоторые из фич, что мы используем сами на некоторых рынках, чуть-чуть анонимизировали их, и предлагаем вам. Получилось N=32 фичи.

Для обучения вам даны 517 последовательностей, каждая длиной в 1000 состояний. Последовательности независимы друг от друга, внутри последовательности состояния упорядочены хронологически. Сами последовательности взяты из событий на одном (или нескольких?) рынках, из окрестностей каких-то интересных (или самых обычных, кто знает) рыночных событий.

Структура данных: независимые последовательности
Структура данных: независимые последовательности

Что предлагается сделать?

Участникам предлагается создать модель, которая сможет предсказывать следующий вектор состояния по последовательности предыдущих состояний.

Задача сложная, многие стандартные допущения про временные ряды не удовлетворены, но задача решаемая. Она близка к тем задачам, что кванты решают на ежедневной основе. Но все жё это модельная задача, и это лишь одна из многих задач, что нужно решить для получения работающей торговой стратегии.

В этом соревновании понимание доменной области / опыт работы с биржевыми данными не требуется.

Про методы

Мы не ограничиваем никакие методы машинного обучения. Исходя из постановки задачи, ожидаем, что наиболее успешными могут оказаться современные нейросетевые архитектуры.


Таймлайн

  • 15 сентября — старт

  • 1 декабря — финиш, конец приёма решений

  • До 15 декабря мы перескорим решения на приватном свежем датасете и определим победителей.

? Призы

Призовой фонд этого челленджа — $13,600 USDT. Топ-8 участников получат денежные призы, возможность попасть в Wunder Fund по фаст-треку, а главное — интеллектуальное удовлетворение от решения сложной задачи.

Присоединяйтесь

Комментарии (0)