Инфраструктура для изучения основ машинного обучения на локальном компьютере с помощью Apache Spark 12.05.2026 15:05 VOrlyanskiy 1 PostgreSQL SQL Базы данных Машинное обучение
Код как документация: как мы строим самодокументируемые витрины данных в Почте Mail +4 12.05.2026 08:12 shveenkov 0 Блог компании VK Tech Блог компании VK Управление разработкой IT-инфраструктура Программирование
Код как документация: как мы строим самодокументируемые витрины данных в Почте Mail +4 12.05.2026 08:12 shveenkov 0 Блог компании VK Tech Блог компании VK Управление разработкой IT-инфраструктура Программирование
Продвинутый анализ на PySpark: учимся работать с рекуррентными соотношениями +1 10.10.2025 08:08 D3vAlex 2 Блог компании Axenix (ex-Accenture) Big Data Data Engineering Python
RocksDB-стейт в стриминге: как ловить потерянные события и дубликаты +6 04.09.2025 13:19 badcasedaily1 1 Блог компании OTUS Apache Программирование Big Data Data Engineering
Оптимизация поисковых систем: баланс между скоростью, релевантностью и масштабируемостью +5 05.08.2025 11:11 kmoseenk 0 Блог компании OTUS Программирование Базы данных Высоконагруженные системы
Пишем движок SQL на Spark. Часть 8: CREATE FUNCTION 05.06.2025 13:20 PastorGL 0 Big Data Hadoop JAVA SQL Программирование
Иногда приходится¹ копаться² в кишках³ Apache Spark +6 27.05.2025 12:54 PastorGL 9 Big Data Data Engineering Hadoop JAVA Программирование
Машинное обучение в Apache Spark с помощью MLlib +9 21.05.2025 18:18 Andrey_Biryukov 0 Блог компании OTUS Машинное обучение Big Data
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов +32 15.05.2025 09:01 SacredDiablo 3 Блог компании билайн Блог компании Конференции Олега Бунина (Онтико) Big Data Data Engineering
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов +32 15.05.2025 09:01 SacredDiablo 3 Блог компании билайн Блог компании Конференции Олега Бунина (Онтико) Big Data Data Engineering
Как мы попробовали Apache Iceberg в связке со Spark и что из этого вышло +7 19.11.2024 11:58 de_linch 9 Блог компании Циан Apache Data Engineering Big Data
Инфраструктура для Data-Engineer Data Lake Apache Iceberg 18.10.2024 06:00 k0rsakov 0 Data Engineering Big Data Data Mining Хранение данных Хранилища данных
Стриминговые фреймворки: Apache Flink +6 25.09.2024 10:31 Systems_Education 1 Анализ и проектирование систем
Искусство ETL. Пишем собственный движок SQL на Spark [часть 7] 23.08.2024 10:19 PastorGL 0 Open source Программирование JAVA SQL Big Data