1.4Kпросмотров
91.6%от подписчиков
25 февраля 2026 г.
Score: 1.5K
В чем я всё больше убеждаюсь, так это в том, что SQL — это ядро входа в data engineering. Это то самое, на чём потом держится всё остальное. В data engineering почти каждый день одна и та же работа:
берёшь данные, которые приехали криво или не так, как ожидалось, и приводишь их в нормальное рабочее состояние. А кривизна там стандартная: дубли, пропуски, странные даты, сломанные связи, бывает что вообще 0 строк или сломался источник для витрины. И вот тут важный момент для тех, кто идёт из аналитики/DS. В аналитике часто уже есть витрина, уже есть нормальные поля, и задача — посчитать. В инженерке задача начинается раньше: сначала разобраться, что вообще приехало, что из этого правда, и где оно по дороге теряется. Поэтому я в заданиях специально даю грязные данные. Не чтобы усложнить жизнь, а чтобы быстрее прокачать правильную привычку: не верить данным на входе и уметь их проверять. Если хотите крепкую базу, вот навыки, которые закрывают очень большой кусок реальных задач: 1️⃣ Группировки и агрегаты
Уметь быстро проверить логику метрик: где сумма должна сходиться, где она может расходиться, и почему так. 2️⃣ Оконные функции
Ранжирование, дедупликация, последнее значение, скользящие. Это постоянно всплывает в задачах про события, историю и инкременты, клиентские портфели за период. 3️⃣ Покрытие и потери данных
Сколько строк отвалилось на JOIN’е, сколько NULL’ов, почему count(*) и count(col) дают разное, где вы теряете клиентов/заказы/события. 4️⃣ Базовые проверки качества
Дубликаты по ключам, обязательные поля, аномалии по датам/суммам, контроль связей. Простые проверочные запросы, которые экономят вам нервы (очень важно). Python и любые следующие технологии, включая SQL-подобные штуки, нормально заходят, когда SQL уже на хорошем уровне. Поэтому если заходите в DE — качайте SQL как рабочий инструмент.
Это окупается очень быстро. Оставлю здесь, вдруг кому пригодится: у меня есть SQL-курсы с большим количеством практики и задач — https://kuzmin-dmitry.ru/#rec1158431336 📌 Сохрани себе, чтобы не потерять.