Наивное введение в CRDT-типы / forpes.ru

Главная
Наивное введение в CRDT-типы

Наивное введение в CRDT-типы +16

11.08.2025 07:03

gvsem 15 1100 Источник

Привет, Хабр! Меня зовут Георгий Семёнов, в VK я занимаюсь разработкой в команде инфраструктуры рекомендательных систем, а в Университете ИТМО начинаю свой аспирантский путь в области децентрализованных коллаборативных сред.

В этой вводной статье я попытаюсь спекулятивно определить CRDT-типы, которые сегодня выступают передовым подходом для создания коллаборативных приложений реального времени. Я намеренно не коснусь многообразия теоретических и практических результатов в области и попробую принять отстраненную позицию, чтобы представить некое «интуиционистское» построение реплицируемых типов с исполнимыми иллюстрациями на Scala.

Коллаборативные приложения

В 1980-x в связи с появлением персональных компьютеров с графическим интерфейсом и мышкой появились перспективы автоматизации бизнеса с помощью внедрения офисных приложений в повседневную жизнь. С тех пор организация совместной работы в электронных средах — цифровой коллаборации — изучается несколькими научными областями — Computer-supported cooperative work (CSCW) и Human-computer interaction (HCI).

Для цифровой коллаборации можно предложить два ключевых основания для классификации:

Синхронность и асинхронность — происходит ли взаимодействие между пользователями в реальном времени. В то время, как существуют строго синхронные (например, видеозвонки) или строго асинхронные (например, работа с кодом) типы коллаборации, в зрелых цифровых средах они склонны перетекать друг в друга. Например, запись живого видеозвонка далее становится артефактом встречи, а работа над текстовым документом в реальном времени может прерываться для неколлаборативных правок.
Оффлайн и онлайн — происходит ли взаимодействие между пользователями «вживую» или через сетевое подключение. Например, в переговорной с участниками оффлайн и онлайн мы держим в голове необходимость говорить с нужной для микрофона громкостью и смотреть в камеру при обращении к собеседнику «за экраном». Ещё пример: в офисе для проверки кода, часто проще остаться на рабочих местах, поскольку — казалось бы, парадоксально — какие-то синхронные процессы удобнее выполнять онлайн.

Нам, как разработчикам, целесообразно иметь в виду описанные выше модальности, чтобы правильно проектировать коллаборативные приложения с поддержкой различных типов коллаборации.

О коллаборативных приложениях мы вынуждены рассуждать в терминах распределённых систем и систем управления базами данных, поскольку коллаборация — это применение конкурентных пользовательских транзакций к какому-то «оракулу» — глобальному источнику правды о том, что есть консолидированное состояние данных.

Невозможность сходу придумать универсальное идеальное коллаборативное программное решение постулирует классическая для распределённых систем CAP-теорема, предложенная Эриком Брюером в 2000 году:

В распределённой системе возможно обеспечить не более двух свойств из следующей тройки:

С — Consistency. Система обеспечивает согласованность данных во всех её вычислительных узлах. Иными словами, от узлов системы без этого свойства в один момент времени можно получить противоречащие ответы.
A — Availability. Система гарантирует наличие ответа за обозначенное время. В противном случае системе позволяется «виснуть» (Timeout) или «лежать» (Denial of Service).
P — Partition Tolerance. Система продолжает функционировать при частичном отказе её вычислительных узлов. Без этого свойства система перестанет функционировать, например, если отвалится диск, память или сеть.

Утверждение, как известно, не является формальным, и поэтому любой разговор вокруг него сводится к «маханию руками». К описанию цифровой коллаборации оно вообще не очень подходит, поскольку мы немедленно сталкиваемся с подменой понятий «вычислительный узел» и «коллаборативный актор». Но попробую спекулятивно проиллюстрировать свойства CAP-теоремы на некоторых режимах коллаборации:

С — Consistency. Все участники видеозвонка должны наблюдать за интерактивной доской в реальном времени и видеть одно и то же, иначе смысл коммуникации пропадёт.
A — Availability. При работе с документом при кратковременном отключении сети содержание документа и локально применённые изменения не должны потеряться.
P — Partition Tolerance. При параллельной работе с кодом участники могут работать автономно с последующем слиянием своих изменений через PR/MR.

При проектировании коллаборативного пользовательского опыта мы всегда ищем баланс между целостностью (Consistency) и доступностью (Availability) данных, с которыми работаем. Давайте рассмотрим, как этот компромисс реализуется на практике.

Пессимистическая репликация

При коллаборативной работе мы избыточно копируем данные для всех коллаборативных акторов — это называется репликацией.

Пессимистическая репликация — режим репликации, при котором объект блокируется на запись для одного пользователя. «Пессимизм» подхода заключается в принципиальном отказе от конкурентных модификаций данных, что заведомо ограничивает возможность коллаборации. Здесь мы обеспечиваем свойство строгой согласованности (strong consistency), жертвуя доступностью.

Схема записи с блокировкой выглядит следующим образом: централизованно или с помощью консенсуса блокируют запись, загружают центральную ревизию данных, модифицируют их, актуализируют центральную ревизию и снимают блокировку.

Достоинства подхода:

Последовательная история изменений с естественным тотальным порядком.
Интерпретируемость коллаборативного процесса.
Отсутствие необходимости объединять конкурентные правки.
Удобство для простых атомарных и сложных слабоструктурированных данных.

Недостатки:

Низкая зрелость коллаборации из-за невозможности работать синхронно.
Использование блокировки в распределённом контуре.

Пессимистический подход широко применяется в СУБД, в системах управления версиями, в облачных хранилищах и приложениях с «толстыми» клиентами (например, в CAD-системах).

Двумя ключевыми режимами синхронизации здесь выступают:

полная репликация: копирование всей ревизии данных (например, rsync);
инкрементальная репликация: распространение патчей — минимальных разностных преобразований над данными (например, diff, или иначе 2-way merge).

Оптимистическая репликация

Оптимистическая репликация — режим репликации, при котором пользователям разрешается работать с данными параллельно. «Оптимизм» заключается в том, что у нас получится консолидировать все конкурентные изменения с помощью некоторой процедуры слияния (merge).

В рамках этого подхода мы обеспечиваем базовую доступность данных (base availability), а от классической согласованности переходим к согласованности в конечном счёте (eventual consistency). Дополнительно проговорив, что мы разрешаем гибкое состояние (soft state) для фоновой синхронизации между репликами данных, мы получили набор требований, который известен как BASE.

Итак, оптимистический подход фактически разрешает свободную децентрализованную коллаборативную работу с данными, предполагая их дальнейшую синхронизацию. Приведу несколько причин, почему это остаётся весьма нетривиальным:

Разрешение конфликтов. При совместной работе невозможно избежать противоречащих друг другу правок — конфликтов. К ним относится широкий класс ситуаций, среди которых:
1. Изменения в атомах. Невозможно семантически корректно определить результат параллельной работы над полем, типу которого соответствуют неделимые, «атомарные» значения.
2. Конкурентные вставки и удаления в списках. Для разрешения такого конфликта недостаточно просто упорядочить операции. Требуется вручную убедиться, что конечное преобразование удовлетворяет пользовательским ожиданиям всех коллаборативных акторов.
3. Ссылочные и алгебраические ограничения. Например, не ясно, как поддержать ограничения кардинальности в коллекциях или ограничения ссылочной целостности.
Сборка мусора. В децентрализованном контуре создаются и удаляются экземпляры сущностей, для полного удаления которых требуется полный консенсус. То же самое — уменьшать и стабилизировать — хотелось бы делать с экземплярами операций, иначе объём метаданных будет стремительно расти.

На данный момент не существует целостного подхода к решению сформулированных выше проблем, однако сильным фундаментом сейчас остаётся идея журнала операций. Как минимум, избежать конфликтов при слиянии данных позволяют следующие подходы:

Тотальное упорядочивание операций. Каждой операции с данными присваивается временная метка: хронологическая (unix timestamp) или логическая (часы Лампорта). Все операции линейно упорядочиваются по времени и применяются в этом порядке.
Каузальное упорядочивание операций. Векторные часы позволяют задать частичный порядок операций, который аналогичен ветвлениям в git. Причинно-следственные отношения образуют полурешётку, которую можно представить в виде диаграммы Хассе. Таким образом, любую операцию относительно любой другой можно охарактеризовать как произошедшую до, после или конкурентно.
Переупорядочивание операций. Существуют операциональные базисы, для которых можно поменять местами операции с заменой их аргументов. Такой подход носит название операциональные преобразования (OT = operational tranformations) и, например, используется в Google Docs для коллаборативной работы над текстом.
Допущение конфликтов данных:
1. Приоритеты. Конфликтующие операции разрешаются в соответствии с некоторым бизнес-правилом. Например, изменения от актора с более широким ролевым доступом приоритизируются, а другие операции утрачивают свою силу.
2. Семантическая реконсиляция. К типу применяется нечёткая процедура слияния, результатом которой является максимальное подмножество, консолидирующее бесконфликтный набор операций, а также набор конфликтов для ручного разрешения пользователями.

Достоинства подхода:

Базовая доступность данных для чтения и модификации.
Поддержка централизованной-децентрализованной и синхронной-асинхронной коллаборации.
Возможность git-подобной интерпретируемой «ветвистости».

Недостатки: необходимость fine-grained метода слияния данных, ревизии которых могут конфликтовать.

Примечательно, что децентрализованное приложение оптимистической репликации можно «пессимизировать», добавив распределённые блокировки, но не наоборот. Поэтому наиболее общим случаем является вариант с оптимистической репликацией.

Получается, что оптимистическая репликация данных не выглядит очень оптимистичной: для её реализации требуется найти баланс между корректностью алгоритмов слияния и их выразительностью применительно к бизнес-логике целевого приложения. Но куда уж деться, это единственный путь навстречу коллаборации в реальном времени.

Синхронизация данных

Обычно в компьютерных науках под «синхронизацией» понимают организацию работы нескольких потоков в общей памяти с помощью мьютексов, семафоров, барьеров и т. п. В коллаборативных архитектурах же рассматривают синхронизацию данных как механизм обеспечения согласованности между узлами.

Существуют некоторые простые случаи, когда синхронизация данных становится тривиальной:

Данные с областью значений в полурешётке. Более общий случай, когда для любых ревизий можно определить их наименьшую верхнюю границу (least upper bound), что и является функцией слияния. Формально, полурешётка — полугруппа с идемпотентной и коммутативной операцией. Её можно построить как подвешенное дерево, в котором разрешили перекрёстные рёбра.
Работа с независимыми данными. Декомпозиция структурированных данных позволяет работать с ними изолированно. На самом деле, это частный случай прошлого, в котором область значений полурешётки — это декартово произведение областей значений независимых данных.

Давайте рассмотрим примеры синхронизации данных без использования дополнительных метаданных.

Синхронизация в постановке «2-way merge». Пусть у нас есть две ревизии данных A и B, требуется определить функцию слияния для получения M — их консолидированного значения. Функция должна быть коммутативной, идемпотентной и ассоциативной.

Для типов с отображением их домена на полурешетку всё просто: такой функцией является минимальная верхняя граница (least upper bound). Например, для множеств со значениями-атомами или для ассоциативных массивов с запретом на правки по «чужим» ключам.

В общем случае двустороннее слияние определить нельзя — например, для ассоциативных массивов могут возникнуть конфликты значений по ключам, а корректную семантику слияния на строках определить совсем трудно.

Если при слиянии данных мы можем воспользоваться знаниями о наименьшем общем предке (иными словами, LCA — least common ancestor), к которому применяли конкурентные модификации, то получится более интересный случай — трёхстороннее слияние.

Синхронизация в постановке «3-way merge». Пусть у нас есть две ревизии данных A и B, являющиеся модификациями общей ревизии M. Аналогично, требуется определить функцию слияния.

Фактически мы извлекаем операциональные разности A/M и B/M, а затем ищем в постановке «2-way merge» результирующую операциональную разность, которую применим к M для получения требуемого результата. Такая постановка для слияния текстовых данных на основе алгоритма Майерса реализована в diff3 и применяется в git. Впрочем, без конфликтов обойтись не получится, например, при конкурентных вставках или удалениях по индексу в списке.

Можно заметить, что обычный «2-way merge» — это 2-way merge на данных, а «3-way merge» — 2-way merge на операциях.

CRDT

CRDT (conflict-free replicated data types) — это оптимистически реплицируемые типы данных с механизмом синхронизации, обладающим формальным свойством строгой конечной согласованности (strong eventual consistency = SEC).

Давайте разберёмся с определением — что означает «отсутствие конфликтов», заложенное в нём? Существует два типа ситуаций, которые называют конфликтами:

Конфликт данных (data conflict). Это ситуации, для которых функция синхронизации в постановке 2-way merge на данных или операциях не определена. Важно, что слияние должно быть функционально «чистым», то есть использование алгоритмов консенсуса недопустимо. Чтобы избежать конфликта данных, достаточно доопределить функцию для конфликтных случаев на основе детерминированного разрешения конфликта данных, например, на основе упорядочивания операций (рассматривалось выше) или детерминированного выбора приоритетной операции (в этом случае потеряем одну из ветвей модификации).

Конфликт данных — это, если угодно, расходящееся распределённое вычисление (⊥). Если предложить теоретико-типовую метафору, слияние — это процедура, по формализму и «синтаксической» сути родственная унификации типовых термов в λ-исчислении.

Так вот, в CRDT-типах формально гарантируется отсутствие конфликтов данных. Иными словами, функция синхронизации в CRDT тотальна.
Конфликт пользовательских намерений (user intention conflict). Это аномалии коллаборативной работы, при которых утрачивается или искажается семантика примененной пользователем модификации по сравнению с той, что подразумевается в однопользовательском контексте. Несмотря на то, что абстрактные типы данных обладают понятным интерфейсом (например, примитивные значения или списки), композиция конкурентных операций может приводить к неожиданным результатам.

Например, при коллаборативной работе с кодом как с текстом могут происходить дублирования include-ов или import-ов. Несмотря на то, что бесконфликтное слияние привело к синтаксически корректному результату, изначальная семантика модификации как добавления в точности одного include-утверждения была нарушена. Таким образом, произошел конфликт пользовательского намерения.

Итак, CRDT-типы (впрочем, как и другие подходы) не смогут избежать конфликтов пользовательских намерений. Однако выбор правильного CRDT-типа для конкретной ситуации может помочь избежать или минимизировать подобные аномалии.

Осталось разобраться с определением строгой конечной согласованности (SEC), которую гарантируют CRDT-типы, — корректные реплики объекта со свойством конечной согласованности с одинаковыми наборами доставленных обновлений обладают эквивалентным состоянием. Иными словами, в присутствии сетевого прогресса компоненты сетевой связности являются классами эквивалентности по ревизиям данных, к которым они относятся.

Свойство SEC является центральным, поскольку оно гарантирует принципиальную невозможность рассинхронизации реплик данных с помощью запрета конфликтов данных.

Итак, давайте определим общую модель распределённой коллаборации на CRDT-типах. Существует набор реплик с динамической сетевой связностью, в каждой из которых располагается ревизия данных. Модификации к репликам применяют локально, а движок синхронизации распространяет изменения на другие реплики. Механизм синхронизации может быть децентрализованным (peer-to-peer), централизованным (c master-ареной) или гибридным (например, централизованная иерархия компонентов peer-to-peer).

CRDT-значение обладает адресом (identity) и внутренним состоянием (payload), из которого извлекают целевое значение. Таким образом, интерфейс CRDT-типа на Scala можно представить так:

trait CRDT[S] {
   def id() : RIdentity
   def apply(): S
}

Основные виды CRDT-типов:

регистр — атомарное значение, которое рассматривается как единое целое;
счётчик — структура с операциональным базисом из инкремента или декремента;
множество — типы для неупорядоченных коллекций;
список или текст — типы для коллаборативной работы над текстом.

В зависимости от интерфейса синхронизации выделяют два класса CRDT-типов — CvRDT и CmRDT.

CvRDT

CvRDT (convergent replicated data type, или state-based CRDT) — это CRDT с механизмом «естественной» синхронизации значений на полурешётках. Слово convergent в аббревиатуре можно интерпретировать неверно: это не значит, что другие классы CRDT не удовлетворяют свойству сходимости, просто CvRDT сходятся на основе слияния состояний.

Определим интерфейс CvRDT на основе функции слияния, возвращающей иммутабельное состояние как результат объединения с другим экземпляром типа:

trait CvRDT[T <: CvRDT[T, S], S] extends CRDT[S] {
   def merge(other: T): T
}

Легко заметить, что операция слияния в CvRDT соответствует слиянию в постановке 2-way merge на данных. Воспользуемся идеей полурешётки и построим простейшие типы CvRDT.

Примеры CvRDT

Max-Register — регистр, принимающий максимальное из значений своих реплик:

case class Max[T : Ordering] (
  value: T,
  objectId: RIdentity = RIdentity.empty
)(
  implicit ordering: Ordering[T]
) extends CvRDT[Max[T], T] {

  override def id(): RIdentity = objectId

  override def merge(other: Max[T]): Max[T] = Max(
    ordering.max(value, other.value),
    objectId
  )(ordering)

  override def apply(): T = value
}

В коде показан пример с типом, в котором задан тотальный порядок — Ordering, однако в общем случае для CvRDT будет достаточно лишь частичного порядка — PartialOrdering.

G-Set (Grow-only set) — множество, в которое можно лишь добавлять элементы:

case class GSet[T](items: Set[T], objectId: RIdentity) extends CvRDT[GSet[T], Set[T]] {
  override def id(): RIdentity = objectId
  override def merge(other: GSet[T]): GSet[T] = GSet(items.union(other.items), objectId)
  override def apply(): Set[T] = items
}

В булеане множества (множестве всех подмножеств) существует отношение частичного порядка, поэтому можно выразительно проиллюстрировать функцию слияния с помощью диаграммы Хассе.

G-Counter (Grow-only counter) — монотонный счётчик с операцией инкремента. В CvRDT-реализации мы воспользуемся трюком с разделением счётчика по независимым шардам, которые будут соответствовать вкладу каждой реплики в общее дело. Иными словами, мы воспользуемся ассоциативным массивом из Max-регистров, в каждый из которых будет писать строго один пользователь. Итоговое значение счётчика определяется как сумма всех Max-регистров:

case class GCounter[T](
  shards: Map[ReplicaId, Max[T]] = Map.empty,
  objectId: RIdentity = RIdentity.empty
)(
  implicit monoid: Monoid[T]
) extends CvRDT[GCounter[T], T] {

  override def id(): RIdentity = objectId

  override def apply(): T = shards.values
	.foldLeft(monoid.empty)
	((r, shard) => monoid.combine(r, shard()))

  override def merge(other: GCounter[T]): GCounter[T] = {
    val replicaIds = shards.keySet.union(other.shards.keySet)

    val mergedShards: Map[ReplicaId, Max[T]] = replicaIds.map { replicaId =>
      val left = shards.get(replicaId)
      val right = other.shards.get(replicaId)

      val merged = (left, right) match {
        case (Some(l), Some(r)) => l.merge(r)
        case (Some(l), None) => l
        case (None, Some(r)) => r
        case (None, None) => throw new IllegalStateException()
      }

      replicaId -> merged
    }.toMap

    GCounter(mergedShards, objectId)
  }
}

Если снова изобразить на диаграмме Хассе, как происходит слияние, то можно увидеть что-то очень похожее на векторные часы. Действительно, G-Counter иллюстрирует идею попытки сведения монотонной временной метки с частичным порядком к монотонному тотально упорядоченному значению.

Регистры

Если ранее для построения CvRDT мы пользовались «естественной сходимостью» типов или трюком с разделением данных, то в общем случае так сделать не получится. Тогда на помощь приходят регистры — «коробочки» для хранения произвольных значений.

LWW-Register (Last-Write-Wins Register) — регистр, значение в котором определяется хронологически последней записью, то есть побеждает тот пользователь, который записал последним.

case class LWWRegister[T](
   value: T,
   timestamp: Instant = Instant.now(),
   objectId: RIdentity = RIdentity.empty
 ) extends CvRDT[LWWRegister[T], T] {

  override def id(): RIdentity = objectId

  def write(newValue: T, newTimestamp: Instant = Instant.now()): LWWRegister[T] = {
    if (newTimestamp.isAfter(timestamp)) {
      LWWRegister(newValue, newTimestamp)
    } else {
      this
    }
  }

  override def merge(other: LWWRegister[T]): LWWRegister[T] = {
    if (other.timestamp.isAfter(this.timestamp)) other else this
  }
}

Очевидным недостатком LWW-регистра является неявная перезапись значения. Эта аномалия способна приводить к конфликтам пользовательских намерений и плохо интерпретируется.

MV-Register (Multi-Value Register) — регистр, аккумулирующий все значения, полученные при параллельных модификациях. Он не позволяет пропустить конкурентное изменение и предлагает способ для ручного разрешения конфликта.

Здесь я опущу пример с реализацией MV-регистра и взамен расскажу, чем она будет отличаться от реализации LWW-регистра:

Переход к частичному порядку. Отказываясь от тотальной упорядоченности временных меток с помощью векторных часов, определим для операций отношение конкурентности. Дизъюнктивное замыкание пар конкурентных операций образует конфликтное множество.
Операция сужения домена конфликтующих значений. Фактически мы хотим позволить пользователям разрешать конфликты, однако противоречащие разрешения конфликтов сами образуют конфликт — это представляет проблему.

CmRDT

CmRDT (commutative replicated data type, или operation-based CRDT) — это CRDT с интерфейсом из коммутирующих операций, то есть их применение в любом порядке приводит к одному и тому же состоянию.

trait CmRDT[T <: CmRDT[T, Op, S], Op, S] extends CRDT[S] {
   def accept(op: Op): T
}

Фактически мы имеем дело с постановкой 2-way merge на операциях, в которых функция слияния — это теоретико-множественное объединение в силу коммутативности операций. Иными словами, если рассмотреть начальное состояние S, из которого конкурентно получены состояния S₁ = S ∘ O₁ и S₂ = S ∘ O₂, то результирующее состояние S’ = S ∘ O₁ ∘ O₂ = S ∘ O₂ ∘ O₁ = S ∘ ( O₁ ⋃ O₂ ).

Об эквивалентности CvRDT и CmRDT

Определим ранее рассмотренный Grow-only Counter как CmRDT-тип. Воспользуемся той же идеей с шардированием вклада различных пользователей, но здесь нам уже не потребуются Max-регистры.

case class GCounter[T](
  shards: Map[ReplicaId, T] = Map.empty,
  objectId: RIdentity = RIdentity.empty
)(
  implicit monoid : Monoid[T]
) extends CmRDT[GCounter[T], GCounter.Op[T], T] {

  override def id(): RIdentity = objectId

  override def apply(): T = shards.values
    .foldLeft(monoid.empty)
    ((r, shard) => monoid.combine(r, shard))

  override def accept(op: GCounter.Op[T]): GCounter[T] = op match {
      case Increment(add : T) => GCounter {
        shards.transform((replicaId, shard) => {
          if (replicaId == op.replica()) monoid.combine(shard, add)
          else shard
        })
      }
    }
  }

object GCounter {
  sealed trait Op[T] extends OpMetadata

  case class Increment[T](add: T)(implicit val ctx : RContext) extends Op[T] with WithIncrement[T] {
    override def replica(): ReplicaId = ctx.me()
    override def incCount(): T = add
  }
}

На самом деле, то, что мы смогли построить один и тот же тип данных как CvRDT и CmRDT, не является случайностью. Существует утверждение об эквивалентности двух этих классов типов [Shapiro et al. 2011; п. 3.2].

Действительно, мы можем тривиально эмулировать любой CvRDT как CmRDT с операцией merge. И наоборот: мы можем сериализовать любой экземпляр CmRDT в CvRDT — монотонно растущее множество операций (G-Set), которыми было порождено текущее состояние объекта.

Заключение

Мы определили CRDT-типы как подход к оптимистической репликации и реализовали несколько примеров. К современным исследовательским проблемам в области относятся формальная верификация моделей на CRDT-типах, построение реплицируемых списков («move-семантика» и проблема «перекрытий») и объектное моделирование в коллаборативных приложениях на основе CRDT.

Комментарии (15)

IisNuINu
11.08.2025 07:26
#28691104
Интересно, но очень сложно!
1. nin-jin
  11.08.2025 07:26
  #28691350
  Я бы сказал галюциногенно. Когда-нибудь у меня дойдут руки запилить курс с понятным объяснением этой, по сути, довольной простой теории. А пока можете глянуть этот обзор.

boldape
11.08.2025 07:26
#28691434
Это все довольно тривиально. Реальные задачи намного веселее.

Расскажите лучше про то как делать упорядоченные пользователем списки да так чтобы интент сохранялся в большинстве случаев, а да забыл элементы в списках не уникальные. Стандартный набор операций добавить, удалить, переместить, заменить. Интент пользователя это задание относительного порядка между элементами списка, т.е. пользователь добавляет/удаляет/перемещает элемент А под элементом Б. Есть групповые операции например пересортировать весь список. Списки размером хотя бы до тысячи элементов. Список реплик открытый - нету возможности сказать, что все реплики получили все изменения и можно безопасно собрать мусор это стандартное требования оффлайн фёст где реплика это просто файл на флэшке который можно скопировать на много других флэшек и например потерять одну из копий.

Уже этого описания достаточно для диссертации, но если, что у меня больше требований - списки сгруппированы в дерево наподобие файловой системы где список это директория - именновпный список, а элементы файлы. Порядок списков в дереве тоже задан пользователем, и самая мякотка - есть операция мерджа двух деревьев, но не по айдентити, а по значению/именам списков, ну или по простому по пути когда два списка с одинаковым путем от корня надо объединить.
1. nin-jin
  11.08.2025 07:26
  #28691564
  Тут есть описание нужного вам алгоритма.
  1. boldape
    11.08.2025 07:26
    #28691804
    Что подходит:
    
    Дубликаты можно
    
    Интент сохранен для базовых операций
    
    Все индивидуальные операции работают прилично
    
    Групповые тоже, но дорого по памяти
    
    Removed item is remain as tombstone for ordering purposes.
    
    +
    
    Открытый список реплик (невозможность габэдж колекшена без каких то трэйдофов)
    
    +
    
    групповые операции на всем списке аля пересортировать все
    
    =
    
    оч быстро приведут к неприличному размеру данных большая часть которых абсолютно бесполезна.
    
    Алгоритм выглядит как квадрат в худшем случае.
    
    Результат мерджа не сохраняет интент получится фарш на выходе.
    
    Так что не зачёт.
    
    boldape
    11.08.2025 07:26
    #28691856
    Ошибся, мердж тоже зачет, но гробики все портят конечно.
    
    nin-jin
    11.08.2025 07:26
    #28692588
    Если "собирать мусор", то реплика поднятая из бэкапа не сможет синхронизироваться. Поэтому лучше не мусорить. К сожалению, от надгробий в той или иной форме не избавиться в принципе. Но их число растёт не очень быстро как правило.
    
    boldape
    11.08.2025 07:26
    #28694606
    Пересортировать список это сразу +Х к числу гробиков где Х это число живых элементов списка. 10 раз сделали получили 10Х гробов + Х живых. Так что быстро растет в тех задачах где есть такие операции.
    
    Я рассматривал похожий вариант правда с деревом которое линеаризуется практически таким же образом как ваш список, но экономит на ссылках нужна всего одна на парента и алгоритм линеаризации там был линейным - просто обход дерева, но тоже гробики.
    
    Я нашел способ со сборкой мусора, но все становится на порядок сложнее.
    
    nin-jin
    11.08.2025 07:26
    #28694728
    Нет, реордер надгробия не добавляет. Только удаление.
    
    boldape
    11.08.2025 07:26
    #28694870
    Так мы об одном и том же говорим. Как делается перемещение? В одном месте удалили в другом добавили. А реодер это удалить все и вставить заново в нужном порядке.
    
    nin-jin
    11.08.2025 07:26
    #28695072
    Нет, перемещение делается через изменение положения. Никаких удалений и вставок.
    
    boldape
    11.08.2025 07:26
    #28695334
    Можете дать ссылку на детальное описание листа или здесь опишите, а то я из ссылки выше не понимаю где это искать
    
    nin-jin
    11.08.2025 07:26
    #28695376
    Каждый юнит (помимо собственно данных) хранит ссылки на родителя и лидера (от фолловера в итоге отказался). Изменил их - юнит перелетел в новое место.
    
    boldape
    11.08.2025 07:26
    #28700976
    Я ещё пару раз перечитал и вижу что интент не сохраняется. Например есть список 1, 2, 3, 4, 5 на время т1. На одной реплике во время Т2 юзер делает - поставить 3 после 1. На другой во время т3 поставить 4 после 1. Ожидаемый результат мерджа : 1, 4, 3, 2, 5. По вашему алгоритму (опять же если я правильно понял, а ваши объяснение не оч помогли если что) то результат будет таким же как во второй реплике на время т3: 1, 4, 2, 3, 5.
    
    И да там точно квадрат вылезает, если взять первоначальный список и применить ряд перестановок аля, 5, 1, 2, 3, 4; 4, 5, 1, 2, 3; ... 1, 2, 3, 4, 5. Т.е. вернуться к первоначальному порядку, то согласно алгоритму элементы в очереди будут в худшем случае нужно будет пропускать все до самого последнего и только последний попадет в результат и так для каждого - классический квадрат.
    
    Без групповых операций это конечно на практике мало вероятно особенно для больших списков, т.к. там юзер вручную должен перемещать элементы на максимальное расстояние, а это много кликов мышкой, но пересортировка в обратном порядке по отношению к айдентити элементов сразу приводит к этой ситуации. Так что это имеет значение.
    
    В общем все равно не зачёт.
    
    nin-jin
    11.08.2025 07:26
    #28701350
    Первый сценарий в актуальном алгоритме без фолловеров выглядит так (перенос одного элемента состоит из изменения его и следующего, чтобы тот не переносился следом):
    
    _A1 aB2 bC3 cD4 dF5 _A1 aC6 aB2 bD7 dF5 | _A1 aD8 aB2 bC3 cF9 _A1 aD8 aC6 cF9 aB2
    
    Большая буква - идентификатор юнита, маленькая - идентификатор лидера, цифра - время.
    
    Тут видно паразитный перенос F из-за параллельного переноса C и D. Думаю стоит вернуться к идее с фолловерами, чтобы такого не происходило.
    
    Второй сценарий, соответственно, такой:
    
    _A1 aB2 bC3 cD4 dF5 _F6 _A1 aB2 bC3 cD4 _D7 _F6 _A1 aB2 bC3 _C8 _D7 _F6 _A1 aB2 _B9 _C8 _D7 _F6 _A1 _A10 _B9 _C8 _D7 _F6
    
    При обработке от старого к новому в изначальном состоянии, юниты позиционируются друг за другом за линейное время. В конечном - все юниты имеют одинакового пустого лидера и по очереди вытесняют предыдущего с первой позиции тоже за линейное время.