Выбираем формат хранения данных в экосистеме Hadoop +1 23.01.2023 14:31 NewTechAudit 11 Программирование Apache Hadoop Data Engineering
Знакомство с Fugue — уменьшаем шероховатости при работе с PySpark +2 12.01.2023 22:27 rufous86 1 Машинное обучение Python Big Data Hadoop Data Engineering
Pyspark. Анализ больших данных, когда Pandas не достаточно +4 29.12.2022 15:27 rufous86 3 Python Big Data Hadoop
Как найти «слона» в песочнице на Hadoop: решаем проблему с ограничением объёма выделенной памяти +6 05.12.2022 16:40 Sber 0 Блог компании Сбер Администрирование баз данных Big Data Hadoop
Выгрузка HDFS FSImage в Hive для мониторинга и аналитики: руководство к действию +2 11.11.2022 17:48 bmurashin 7 Блог компании X5 Tech Системное администрирование Big Data Hadoop
Что должен знать дата-инженер. Роадмап для джуниора +21 30.08.2022 11:02 vasenkovid 2 Блог компании Lamoda Big Data Карьера в IT-индустрии Hadoop Data Engineering
Как реализовать магию Sqoop для загрузки данных через Spark +10 29.07.2022 16:19 Bee_brightside 2 Блог компании Билайн Бизнес SQL Big Data Хранение данных Hadoop
«Kubernetes как часть data platform» 14.06.2022 17:03 oneFactor 0 Блог компании oneFactor Hadoop Kubernetes
Apache Atlas – доступный data catalog +7 25.05.2022 18:33 SnezhSh 9 Блог компании GlowByte Apache Hadoop
Использование Kudu для решения задач в реальном времени в окружении Hadoop -1 06.05.2022 17:18 EvgenyVilkov 0 Блог компании GlowByte Big Data Хранилища данных Hadoop
Как в PayPal разработали Dione — Open-source-библиотеку индексирования данных для HDFS и Spark +9 23.03.2022 10:54 Olga_Mokshina 1 Блог компании VK Big Data Хранилища данных Hadoop
Области применения инструмента Apache Sqoop -1 20.01.2022 15:54 neoflex 5 Блог компании Neoflex SQL Apache Hadoop
Cloudera Streaming Analytics: унификация пакетной и потоковой обработки в SQL 10.01.2022 11:33 Cloudera 1 Блог компании Cloudera Big Data Хранилища данных Hadoop Data Engineering
Хранилище данных vs. Data Lake. Или почему важно научиться ходить перед тем, как начать бегать +2 15.12.2021 15:44 URS_CDO 11 Блог компании Уралсиб Big Data Хранилища данных Hadoop
ksqlDb или SQL как инструмент обработки потоков данных +7 08.12.2021 16:37 neoflex 2 Блог компании Neoflex Hadoop Софт