ААйти-Пингвин | Дата инженер

Айти-Пингвин | Дата инженер

@data_penguin💻 Технологии🇷🇺 Русский📅 март 2026 г.

Канал главного разработчика Data Lake крупного банка. База знаний для джунов, разбор собесов, задачи (jun/mid/sen) с решениями, полезные материалы, обзоры технологий и архитектур. По вопросам и менторству писать @it_pengwin

📊 Полная статистика📝 Все посты
##39#тех_собес#middle#собеседование#подписчик#junior
2.0K
Подписчики
1.7K
Ср. охват
88.9%
Вовлечённость
20
Постов
~0.3
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

20 из 20
Ddata_penguin
data_penguin
2 февр., 07:44

Обзор собеседования Должность: Data Engineer Компания: ООО Тера Интегро Тип собеса: #тех_собес Грейд: #Junior #middle Вилка: 210к Вакансия: https://spb.hh.ru/vacancy/128761959 Итог собеса: Отказ, тк кандидат еще учится в универе ❌ Краткий обзор собеседования: Вопросы про БД: • Как вы начинаете изучать почему запрос стал работать медленнее какие шаги предпринимаете и на что смотрите? • Какие физические виды Join бывают, их алгоритм выполнения? • (Greenplum) Есть таблица транзакций 1 млрд записей ...

👁 3.5K
Ddata_penguin
data_penguin
22 янв., 07:48

Удаление дублей в Greenplum Как-то я писал пост про удаление полных дублей из таблицы. В обычных СУБД можно разделить полностью одинаковые строки по скрытому системному полю, например, по rowid (Oracle), ctid (PostgreSQL). И кстати хочу сделать небольшое дополнение к этим полям, они вообще-то немного разные: ROWID - это физический адрес строки в базе данных. CTID - это физический адрес строки в конкретной таблице. ——- Greenplum, как известно, это MPP система. И по сути, под капотом параллельно р...

👁 2.7K📷 photo
Ddata_penguin
data_penguin
26 янв., 08:24

Как хорошо быть айтишником в 2025 2026 💅

👁 2.6K🎬 video
Ddata_penguin
data_penguin
9 февр., 08:25

Обзор собеседования Должность: Data Engineer Компания: EmployCity Тип собеса: #тех_собес Этапы: 1 техничка > тестовое задание, созвон и обсуждение решения > знакомство с командой Грейд: #middle Вилка: 3-4к евро плюс оплата перелета и 700 евро на проживание каждый месяц Вакансия: https://hh.ru/vacancy/128579553 Итог собеса: 1 этап прошел Краткий обзор собеседования: Вопросы по CDC: • Как работал со связкой Kafka+CDC? • Как забирали историчные данные с источника CDC? Вопросы по dbt: • Какие матери...

👁 2.2K
Ddata_penguin
data_penguin
16 февр., 08:29

Очередные вопросы по SQL с собеседования Итак, дана таблица с одним полем flag CREATE TABLE sandbox.test (flag integer); INSERT INTO sandbox.test (flag) VALUES (0), (1), (2), (3), (4), (5), (null), (null); Давайте закрепим популярные вопросы про count • select count() from sandbox.test; -- Результат 8 • select count(1) from sandbox.test; -- Результат 8 • select count(0) from sandbox.test; -- Результат 8 • select count(null) from sandbox.test; -- Результат 0 • select count(flag) from sandbox.test...

👁 2.1K
Ddata_penguin
data_penguin
19 янв., 08:08

Накрутка опыта Да, да. Та самая холиварная тема. Я ни разу не писал по этому поводу. Понимаю и тех кто за накрутку и тех кто против. Каждый выбирает свое. Я считаю, что проблема должна решаться сверху законами, решениями и тд. Например, проверкой трудовой ВСЕМИ компаниями. Или же, чтоб количество лет в резюме не было главным фильтром при выборе кандидата. Пока есть легкий путь трудоустройства в it, люди будут им пользоваться. Но сейчас я хочу сказать аргумент ЗА НАКРУТКУ обычных работяг. Знаете ...

👁 2.0K
Ddata_penguin
data_penguin
12 февр., 09:00

Коллектив, тимбилдинги и корпораты - это реально важно 🙌 В одной из моих первых IT-компаний был оч крутой коллектив. У нас имелся свой маленький закрытый чатик с личными мемасами и внутренними шутками. Мы могли поугарать над заказчиками, поболтать на рандомные темы или просто сидеть на созвоне часами, параллельно работая. А тусовки были вообще огонь..💔

👁 1.9K🎬 video
Ddata_penguin
data_penguin
16 янв., 08:23

Ну мы же 🥳 *при том нейронки этой же компании

👁 1.9K🎬 video
Ddata_penguin
data_penguin
27 февр., 08:39

Вопросы с hr скрининга 1️⃣ 1 + NULL в SQL = NULL 2️⃣ Типы физических джоинов = Nested Loop, Hash, Merge, Broadcast (в Spark) 3️⃣ Какими оконными функциями можно получить номер строки = ROW_NUMBER(), RANK(), DENSE_RANK() 4️⃣ Может ли быть число ключом словаря = да 5️⃣ Может ли быть строка ключом словаря = да 6️⃣ Может ли быть список ключом словаря = нет 7️⃣Какое максимально и минимальное число драйверов может быть в спарк = min/max =1 (в одном Spark-приложении) it пингвин | data engineer 🐧

👁 1.6K
Ddata_penguin
data_penguin
3 мар., 14:21

Мне тут прилетел подгончик от моего топового менти У нас была цель - в сжатые сроки устроиться на работу. Менти всё это время жёстко гикал, и в итоге мы достигли результата: спустя два месяца после начала занятий он уже вышел на свою первую работу в DE ✅ Испытательный срок тоже успешно пройден - на работе им довольны. Параллельно он начинал вести канал, но из-за высокой нагрузки пришлось поставить на паузу. Скоро вернётся к постам. Его тэгэшчка 🔜 DROP TABLE И вот мне прилетел обещанный тречок (...

👁 1.6K📷 photo

Типы хуков

Нейтральный16 | 1.8K просм.
Статистика3 | 1.7K просм.
История1 | 1.6K просм.

Длина постов

Очень длинные (1000+)6 | 2.2K просм.
Короткие (<200)5 | 1.5K просм.
Длинные (500-1000)4 | 1.7K просм.
Средние (200-500)4 | 1.5K просм.

Влияние эмодзи

1.9K
С эмодзи (12)
1.6K
Без эмодзи (8)
+16.1% охвата

Типы контента

🎬
4
video
1.9K просм.
📝
12
text
1.7K просм.
📷
4
photo
1.6K просм.
Айти-Пингвин | Дата инженер (@data_penguin) — Telegram-канал | PostSniper