Обзор собеседования Должность: Data Engineer Компания: ООО Тера Интегро Тип собеса: #тех_собес Грейд: #Junior #middle Вилка: 210к Вакансия: https://spb.hh.ru/vacancy/128761959 Итог собеса: Отказ, тк кандидат еще учится в универе ❌ Краткий обзор собеседования: Вопросы про БД: • Как вы начинаете изучать почему запрос стал работать медленнее какие шаги предпринимаете и на что смотрите? • Какие физические виды Join бывают, их алгоритм выполнения? • (Greenplum) Есть таблица транзакций 1 млрд записей ...
Айти-Пингвин | Дата инженер
Канал главного разработчика Data Lake крупного банка. База знаний для джунов, разбор собесов, задачи (jun/mid/sen) с решениями, полезные материалы, обзоры технологий и архитектур. По вопросам и менторству писать @it_pengwin
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Удаление дублей в Greenplum Как-то я писал пост про удаление полных дублей из таблицы. В обычных СУБД можно разделить полностью одинаковые строки по скрытому системному полю, например, по rowid (Oracle), ctid (PostgreSQL). И кстати хочу сделать небольшое дополнение к этим полям, они вообще-то немного разные: ROWID - это физический адрес строки в базе данных. CTID - это физический адрес строки в конкретной таблице. ——- Greenplum, как известно, это MPP система. И по сути, под капотом параллельно р...
Как хорошо быть айтишником в 2025 2026 💅
Обзор собеседования Должность: Data Engineer Компания: EmployCity Тип собеса: #тех_собес Этапы: 1 техничка > тестовое задание, созвон и обсуждение решения > знакомство с командой Грейд: #middle Вилка: 3-4к евро плюс оплата перелета и 700 евро на проживание каждый месяц Вакансия: https://hh.ru/vacancy/128579553 Итог собеса: 1 этап прошел Краткий обзор собеседования: Вопросы по CDC: • Как работал со связкой Kafka+CDC? • Как забирали историчные данные с источника CDC? Вопросы по dbt: • Какие матери...
Очередные вопросы по SQL с собеседования Итак, дана таблица с одним полем flag CREATE TABLE sandbox.test (flag integer); INSERT INTO sandbox.test (flag) VALUES (0), (1), (2), (3), (4), (5), (null), (null); Давайте закрепим популярные вопросы про count • select count() from sandbox.test; -- Результат 8 • select count(1) from sandbox.test; -- Результат 8 • select count(0) from sandbox.test; -- Результат 8 • select count(null) from sandbox.test; -- Результат 0 • select count(flag) from sandbox.test...
Накрутка опыта Да, да. Та самая холиварная тема. Я ни разу не писал по этому поводу. Понимаю и тех кто за накрутку и тех кто против. Каждый выбирает свое. Я считаю, что проблема должна решаться сверху законами, решениями и тд. Например, проверкой трудовой ВСЕМИ компаниями. Или же, чтоб количество лет в резюме не было главным фильтром при выборе кандидата. Пока есть легкий путь трудоустройства в it, люди будут им пользоваться. Но сейчас я хочу сказать аргумент ЗА НАКРУТКУ обычных работяг. Знаете ...
Коллектив, тимбилдинги и корпораты - это реально важно 🙌 В одной из моих первых IT-компаний был оч крутой коллектив. У нас имелся свой маленький закрытый чатик с личными мемасами и внутренними шутками. Мы могли поугарать над заказчиками, поболтать на рандомные темы или просто сидеть на созвоне часами, параллельно работая. А тусовки были вообще огонь..💔
Ну мы же 🥳 *при том нейронки этой же компании
Вопросы с hr скрининга 1️⃣ 1 + NULL в SQL = NULL 2️⃣ Типы физических джоинов = Nested Loop, Hash, Merge, Broadcast (в Spark) 3️⃣ Какими оконными функциями можно получить номер строки = ROW_NUMBER(), RANK(), DENSE_RANK() 4️⃣ Может ли быть число ключом словаря = да 5️⃣ Может ли быть строка ключом словаря = да 6️⃣ Может ли быть список ключом словаря = нет 7️⃣Какое максимально и минимальное число драйверов может быть в спарк = min/max =1 (в одном Spark-приложении) it пингвин | data engineer 🐧
Мне тут прилетел подгончик от моего топового менти У нас была цель - в сжатые сроки устроиться на работу. Менти всё это время жёстко гикал, и в итоге мы достигли результата: спустя два месяца после начала занятий он уже вышел на свою первую работу в DE ✅ Испытательный срок тоже успешно пройден - на работе им довольны. Параллельно он начинал вести канал, но из-за высокой нагрузки пришлось поставить на паузу. Скоро вернётся к постам. Его тэгэшчка 🔜 DROP TABLE И вот мне прилетел обещанный тречок (...