1.4Kпросмотров
91.6%от подписчиков
25 февраля 2026 г.
Score: 1.5K
В чем я всё больше убеждаюсь, так это в том, что SQL — это ядро входа в data engineering. Это то самое, на чём потом держится всё остальное. В data engineering почти каждый день одна и та же работа: берёшь данные, которые приехали криво или не так, как ожидалось, и приводишь их в нормальное рабочее состояние. А кривизна там стандартная: дубли, пропуски, странные даты, сломанные связи, бывает что вообще 0 строк или сломался источник для витрины. И вот тут важный момент для тех, кто идёт из аналитики/DS. В аналитике часто уже есть витрина, уже есть нормальные поля, и задача — посчитать. В инженерке задача начинается раньше: сначала разобраться, что вообще приехало, что из этого правда, и где оно по дороге теряется. Поэтому я в заданиях специально даю грязные данные. Не чтобы усложнить жизнь, а чтобы быстрее прокачать правильную привычку: не верить данным на входе и уметь их проверять. Если хотите крепкую базу, вот навыки, которые закрывают очень большой кусок реальных задач: 1️⃣ Группировки и агрегаты Уметь быстро проверить логику метрик: где сумма должна сходиться, где она может расходиться, и почему так. 2️⃣ Оконные функции Ранжирование, дедупликация, последнее значение, скользящие. Это постоянно всплывает в задачах про события, историю и инкременты, клиентские портфели за период. 3️⃣ Покрытие и потери данных Сколько строк отвалилось на JOIN’е, сколько NULL’ов, почему count(*) и count(col) дают разное, где вы теряете клиентов/заказы/события. 4️⃣ Базовые проверки качества Дубликаты по ключам, обязательные поля, аномалии по датам/суммам, контроль связей. Простые проверочные запросы, которые экономят вам нервы (очень важно). Python и любые следующие технологии, включая SQL-подобные штуки, нормально заходят, когда SQL уже на хорошем уровне. Поэтому если заходите в DE — качайте SQL как рабочий инструмент. Это окупается очень быстро. Оставлю здесь, вдруг кому пригодится: у меня есть SQL-курсы с большим количеством практики и задач — https://kuzmin-dmitry.ru/#rec1158431336 📌 Сохрани себе, чтобы не потерять.
1.4K
просмотров
2049
символов
Нет
эмодзи
Нет
медиа

Другие посты @kuzmin_dmitry91

Все посты канала →
В чем я всё больше убеждаюсь, так это в том, что SQL — это я — @kuzmin_dmitry91 | PostSniper