Привет!
Идея в том, что бы использовать ленивые кешируемые свойства везде в неизменяемых объектах, где в обычном случае мы бы использовали процессорно тяжелые методы без аргументов. А статья — как это задизайнить и зачем.

Обращение к ленивому свойству объекта наглядно
Этот подход не подойдет в случаях:
1) Если вы пишете что-нибудь сверхбыстрое, и красивый код — последнее, о чем думаете
2) Если ваши объекты никогда не используются дважды (например, беспрекословно соблюдается SRP)
3) Если вы настолько ненавидете свойства, что код их содержащий в ваших глазах покрывается блюром
TL;DR в самом низу.
Почему зло?
Приведу утрированный пример. Предположим, у нас есть неизменяемый рекорд Integer, определенный следующим образом:
public sealed record Integer(int Value);У него есть одно свойство Value типа int. Теперь, нам понадобился следующий метод:
public sealed record Integer(int Value)
{
public Integer Triple() => new Integer(Value * 3);
}Каждый раз при необходимости утроить инстанс нашего числа, придется вызывать этот метод, и брать на себя ответственность за кеширование. Например, придется писать
public int SomeMethod(Integer number)
{
var tripled = number.Triple();
if (tripled.Value > 5)
return tripled.Value;
else
return 1;
}Вместо того, что бы писать
public int SomeMethod(Integer number)
=> number.Tripled > 5 ? number.Tripled.Value : 1;Красивее, короче, читабельнее, безопаснее. Потенциально, оно также быстрее, если у нас к одному и тому же Tripled происходит обращение не только здесь.
Что нам хочется?
- Удобный дизайн кода для его пользователя. Например, я не хочу думать о кешировании при обращении к объекту, я просто хочу от него данные.
- Бесплатность обращения к свойству. Время я плачу только за первое обращение, и это никогда не хуже, чем вызов метода (обычно — почти как обращение к полю по стоимости).
- Удобный дизайн кода для его разработчика. Разрабатывая новый immutable object, я не хочу оверрайдить конструктор,
EqualsиGetHashCodeрекорда просто потому, что я добавил какое-то приватное поле для кеша, которое внезапно ломает мне все сравнения.
Я уже привел пример того, насколько удобнее свойства чем методы, в очень простом случае. А как разработчик объекта, я хочу писать так:
public sealed record Number(int Value)
{
public int Number Tripled => tripled.GetValue(@this => new Number(@this.Value * 3), @this);
private FieldCache<Number> tripled;
}Можно было лучше, и насколько мне известно, в джаве это решается аттрибутом Cacheable. В шарпе недавно добавленные source-генераторы код изменять не могут, а значит такой же красоты мы по-любому не получим. Поэтому этот сэмпл — лучшее, к чему я смог прийти.
А вот как пишут обычно:
Подход 1 (да зачем нам кеш?):
public sealed record Number(int Value)
{
public int Number Tripled => new Number(@this.Value * 3);
}(очень дорогой по очевидным причинам)
Подход 2 (используем Lazy<T>):
public sealed record Number : IEquatable<Number>
{
public int Value { get; init; } // приходится оверлоадить конструктор, поэтому выносим сюда
public int Number Tripled => tripled.Value;
private Lazy<Number> tripled;
public Number(int value)
{
Value = value;
tripled = new(() => value * 3); // мы не можем это сделать в конструкторе поля, потому что на тот момент this-а еще не существует
}
// потому что Equals, который генерируется для рекордов, генерируется на основе полей, и поэтому наш Lazy<T> все сломает
public bool Equals(Number number) => Value == number.Value;
// то же самое с GetHashCode
public override int GetHashCode() => Value.GetHashCode();
}Как мы видим, очень сложно и неадекватно становится дизайнить наш объект. А что если там не одно кешируемое свойство, а несколько? За всем придется следить, включая все оверрайды.
Более того, у нас перестанет работать with, который клонирует все ваши поля, кроме указанного(-ых). Ведь он скопирует и ваше поле с Lazy, в котором будет лежать уже неверный кеш.
Подход 3 (используем ConditionalWeakTable):
public sealed record Number
{
public Number Tripled => tripled.GetValue(this, @this => new Integer(@this.Value * 3));
private static ConditionalWeakTable<Number, Number> tripled = new();
}Наиболее адекватное решение среди прочих. Но для него придется писать обертку над ValueType так как ConditionalWeakTable принимает только референс-тип. Поэтому такая штука существенно медленнее, чем что-то подобное без оверхеда (по моему бенчмарку получается разница в, по меньшей мере, 6 раз, по сравнению с типом, о котором я расскажу).
Подход 4 (сразу посчитать):
public sealed record Number
{
public int Value { get; init; }
public Number Tripled { get; }
public Number(int value)
{
Value = value;
Tripled = new Number { Value = value * 3 };
}
}В конкретно этом случае это вообще даст stackoverflow, но даже если нам повезло, и кешируемый тип не совпадает с "холдером" — нам гарантированно придется заплатить временем за эту инициализацию, которая нам может и не понадобиться.
Решение
- Итак, начнем с того, что наш ленивый контейнер будет структурой. Зачем лишний раз
кучить мучумучить кучу? EqualsиGetHashCodeвсегда будут возвращатьtrueи0соответственно. Это убивает смысл этих методов, но этот контейнер нам нужен только ради кеша, а значит сам по себе не должен влиять на результаты сравнения двух рекордов или получения хеша. Таким образом, мы не обязаны оверрайдитьEqualsиGetHashCodeдля каждого рекорда, пусть об этом думает Рослин.- Допустим любой тип в качестве кешируемого. Лочить будем по холдеру, то есть тому, в ком объявлен наш кеш.
- Фабрика передается не в конструкторе, а в методе
GetValue, по тому же принципу, как уConditionalWeakTable. Тогда не придется создавать конструктор и писать спаггети-код, как мы это делали сLazy<T>. - Чтобы не сломать замечательную операцию
with, вместо переменнойinitializedмы будем сравниватьholder, и в случае изменения референса — запускаем фабрику снова.
Коду!
Для начала, так у нас выглядят поля и оверрайденные методы:
public struct FieldCache<T> : IEquatable<FieldCache<T>>
{
private T value;
private object holder; // от этой штуки нам нужен ТОЛЬКО референс, смысла делать его generic нет
// как я уже говорил, сделано, чтобы рослиновский Equals не сломался от приватного поля
public bool Equals(FieldCache<T> _) => true;
public override int GetHashCode() => 0;
}И примитивная имплементация GetValue выглядит так:
public struct FieldCache<T> : IEquatable<FieldCache<T>>
{
public T GetValue<TThis>(Func<TThis, T> factory, TThis @this) where TThis : class // record - это тоже класс. А ограничение нужно, чтобы тип был референсным
{
// если холдер изменился ИЛИ еще не записывался (например, если он - null)
if (!ReferenceEquals(@this, holder))
lock (@this)
{
if (!ReferenceEquals(@this, holder))
{
// мы передаем в фабрику, потому что наш FieldCache нужен для случаев, когда какие-то кешируемые проперти зависят ТОЛЬКО от полей нашего самого холдера. Можно, конечно, и захватить в передаваемой лямбде, но тогда будет реаллокация каждый раз
value = factory(@this);
holder = @this;
}
}
return value;
}
}Таким образом, мы можем себе позволить такой дизайн:
public sealed record Number(int Value)
{
public int Number Tripled => tripled.GetValue(@this => new Number(@this.Value * 3), @this);
private FieldCache<Number> tripled;
}Код очень короткий, и его можно найти на гитхабе.
Производительность
Единственное, что быстрее, чем наш наивный FieldCache — это встроенный Lazy<T>.
| Method | Mean |
|---|---|
| BenchFunction | 4,599.1638 ns |
| Lazy | 0.6717 ns |
| FieldCache | 3.6674 ns |
| ConditionalWeakTable | 25.0521 ns |
BenchFunction — это какие-то сложные страшные вычисления, которые производились бы каждый раз при обращении к методу, поэтому мы хотим его кешировать. Другие три строчки занимают три разных подхода. Как видим, FieldCache<T> немного помедленнее, чем Lazy<T>.
Я считаю, что так как он все равно занимает не очень много времени, во многих местах адекватный дизайн будет лучше, чем пару сэкономленных наносекунд.
Кратый TL;DR или выводы
Хотелка: ленивые кешируемые свойства неизменяемых объектов, зависящие от первичных свойств данных объектов.
И известные существующие подходы, по всей видимости, не дают это красиво сделать, поэтому приходится писать свое.
WhiteBlackGoose Автор
Сам
FieldCacheиспользую в своем проекте (через NuGet). Не уверен, что кому-то нужен сам пакет, потому что гениального тут ничего нет, и, вероятно, проще написать свой велосипед.Я использую эту штуку в своей библиотеке символьной алгебры, в которой такой паттерн чертовски полезен для математических выражений. Например, у математического выражения есть свойства
InnerSimplified,Evaled,IsFiniteи прочие, которые необходимо кешировать, так как количество обращений к ним непредсказуемо.Примеры: InnerSimplified, Evaled.
Тут вызываются рекурсивные методы, которые в общем случае должны были бы обходить все дерево выражения. В данном случае, при первом обращении к свойству, вычисления будут происходить основываясь на свойствах детей. К примеру, если мы хоть раз обратились к свойству
Evaledу выражения2^5, то при обращении к этому же свойству у выражения2^5 + 3у нас не будет заново вычисляться2^5. И это, по моему мнению, должно инкапсулироваться именно холдером, чтобы при обращении к свойству ни о чем думать не нужно было, и считать это обращение — бесплатным.DmitryLTL
Если это кэш, то было бы неплохо иметь возможность его инвалидировать.
Особенно групповая, когда множество зависимых свойств инвалидировать одновременно. Иначе это lazy2 а не cache
WhiteBlackGoose Автор
Это и есть ленивая инициализация. Но так как у нас неизменяемые объекты, то и сами закешированные значения никогда не станут неверными
De-Korg
Смотрите, может быть кейс когда их много и когда одно свойство ссылается на пару других. Ваш подход поощряет стиль написания кода, который может привести к такой ситуации.
Как тогда искать начало и конец инициализации?
WhiteBlackGoose Автор
Да, верно. А вот что значит "искать начало и конец инициализации" — не очень понятно. Если вы хотите что-то отдебажить, достаточно изолировать ваш объект от других, и при первом обращении попадете туда, куда нужно. Хотя можно и проще: поставить условные бряки и когда-нибудь ваш метод вызывется.