V
VK Tech
@vk_digital_tech2.5K подп.
739просмотров
29.9%от подписчиков
5 марта 2026 г.
📷 ФотоScore: 813
Когда BI и ML работают как единый механизм В классическом подходе аналитика данных и машинное обучение существуют параллельно, но редко дружат. BI строится на DWH (СУБД), ML — на Data Lake. В VK Data Platform мы объединили их. Что дает объединение? ✔️ Снижение TCO: одно железо, одна платформа, одна команда инженеров данных — вместо двух параллельных вселенных. Расходы на поддержку сокращаются естественным образом. ✔️ Ускорение вывода дата-продуктов: отчеты, витрины, ML-модели готовятся быстрее, потому что данные не нужно перекладывать между системами. Модели можно обучать прямо на тех же источниках, на которых строится аналитика. ✔️ Быстрый переход из теста в прод: нет замедления при переносе модели. Какие механизмы контроля качества данных встроены в VK Data Platform? В VK Data Platform мы уделяем особое внимание тому, чтобы данные были прозрачными и надежными. Также есть Apache Iceberg. Это ключевой компонент, превращающий обычный Data Lake в управляемый Data Lakehouse. Iceberg хранит расширенные метаданные и снапшоты. Это значит, что можно увидеть все изменения, которые происходили с данными: кто, что, когда поменял. И главное — к любому снапшоту можно откатиться за секунды. Какие дальнейшие планы по развитию платформы? Сейчас мы делаем удобный каталог, интегрированный с нашим S3-хранилищем. Также есть планы по внедрению обслуживания таблиц Iceberg сразу в S3-хранилище. Еще хотим интегрировать инструменты управления данными.
739
просмотров
1462
символов
Нет
эмодзи
Да
медиа

Другие посты @vk_digital_tech

Все посты канала →
Когда BI и ML работают как единый механизм В классическом по — @vk_digital_tech | PostSniper