➡️Pattern matching(Префиксное сопоставление) Не все из указанных сегодня ф-ций подходят под определение классических Pattern Matching инструментов, но они отлично подходят для префиксного сопоставления из предыдущего поста, продолжение которого я обещал.😌 В процессе сбора информации, дабы быть максимально объективным, я наткнулся на статью в Хабре, которая отлично раскрывает сколько лошадок под капотом у каждого из рассматриваемых методов! (С применением индексов!). Вкратце, добродушный Хабрчан...
Дата Инжир
Твой Data Engineer путеводитель в мир IT. • советы для новичков • тестовые из бигтехов • учебные материалы • рабочие кейсы • новости из IT • лайфстайл Поддержать https://t.me/god_given_it?boost Автор: @socloseeee Инст: _socloseeee_ Просто о сложном!
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
16 из 16➡️Оконные функции в SQL — Что такое фреймы простыми словами. 1️⃣Определение: Фрейм — это диапазон строк, с которыми работает оконная функция внутри окна (OVER (...)). Он позволяет гибко управлять тем, какие строки попадут в расчет. Это важно, когда нужно, например, посчитать кумулятивные значения или сделать «скользящее окно». Синтаксис фрейма: <функция> OVER ( PARTITION BY ... ORDER BY ... ROWS BETWEEN <граница_начала> AND <граница_конца> -- Строка с фреймом ) 💡Тип фрейма чаще всего: ROWS 2️⃣Т...
➡️DE-будни Каждый, Big-Data шахтёр однозначно раз в жизни сталкивался с ситуацией, когда нужно было неоднозначным сопоставлением в условии (LIKE/~) отобрать определённые значение на основе фильтрации некоего атрибута. У такого типа операций есть своего рода название - Pattern Matching. Например, ситуация: Недавно я решил скачать выписки по всем накопительным счетам и карточкам из СберПанка 💸🖤 Вопрос зачем? - мне стало интересно, проанализировать свои расходы/заработки (белые) и вот придумал се...
➡️Про уверенность на собеседованиях. Мой опыт. Первое чего боятся многие люди на собесах и что мешает им быть уверенными - это показаться идиотом или, говоря мягче, "создать плохое впечатление о себе". Нас с детства учат создавать везде и всюду о себе хорошее или даже идеальное первое впечатление, ведь это фундамент для последующих взаимоотношений. Это как бы правильно, но только излишний страх сковывает вас и заставляет замирать, грубо говоря, тупеть 🐱 Хочу провести с вами ментальную гимнастик...
Занимаетесь архитектурой DWH и моделированием данных? Подготовил список постов по теме: • Модели данных: концептуальная, логическая, физическая • Ральф Кимбалл и его модель звёздочки • Билл Инмон против Кимбалла: почему важно серьёзно подходить к моделированию • О четырёх слоях данных по Инмону • Пример реальной архитектуры данных (основано на реальных кейсах из ритейла) • Медленно меняющиеся измерения (без которых также трудно представить Data Vault) • Data Vault как пример гибкой методологии п...
➡️Где посты? >> Вам в рифму или по существу? :P На моём канале чудовищно маленькое кол-во душевных и искренних постов, а ведь это мой канал, про меня и мой уникальный опыт! На самом деле в последнее время в моей жизни произошло много перемен и так как это всё таки ещё и мой личный блог, то почему бы не поделиться ими с любимыми подписчиками? Топ вещей, произошедших со мной с момента последнего поста: 🔵Теперь я магистр 🔵🎓 🔵Я переехал 🚶🏼♂️➡️🚛 🔵Начал учёбу на права 🚑 Помимо вышеперечисле...
➡️ Задачи с 1-го этапа собеседования в Т-Банк 💸 🔵ПРЕДИСЛОВИЕ Недавно проходил собеседования в очередную большую "банку" и очень важную (по их мнению). С кучей конкурсов, тамадой и олимпийскими играми на этапах собеседования. Кроме шуток 🐸, было три этапа: 1. СекцияSQL + Программирование 2. Секция анализа и моделирования 3. Проектирование и построение ETL-процессов Я прошёл все этапы собеседований😓, но финальные предложения меня не заинтересовали 🚬. Сегодня я решил поведать вам парочку задач...
➡️ Задачи с 2-го этапа собеседования в Т-Банк 💸 🔵ПРЕДИСЛОВИЕ 🔵🔵🔵🔵🔵🔵🔵🔵 Ну вот и настал черед поведать о втором этапе в желтый банк. Данную секцию они именует как «секция анализа и моделирования», эпично, но что же скрывается за этим этапом на самом деле! 🤨 Кто бы мог подумать, начинается все с "классического" опоздания, ну ладно, может у человека внезапно потерялся интерес проводить собеседование к примеру, дело богоугодное. 🖕 После начала интервьюер кинул задачку на проектирование. И...
➡️Параллельная обработка SQL-запросов в Greenplum. Как Greenplum выполняет запросы: что происходит «под капотом»? 👀 1️⃣ Откуда происходит рассылка планов запросов на сегменты? Для ответа на этот вопрос необходимо знать ответ на другой - чем собственно мастер-хост отличается от сегмент-хостов? Не трудно догадаться, что именно к мастер-сегменту подключаются пользователи и отправляют на него все SQL-запросы. Мастер-сегмент не содержит данных, а только принимает входящие подключения, собирает и сис...
➡️Что же такое Greenplum и в чем его магия? Для самых маленьких! 1️⃣Определение: GreenPlum - массово-параллельная (Massive Parallel Processing) реляционная СУБД на основе PostgreSQL. Далее: GP - Greenplum MPP - Massive Parallel Processing. 2️⃣Архитектура: GP относится к shared nothing архитектуре(Shared Nothing Architecture). То есть, простым языком - это распределённая вычислительная архитектура, в которой каждый узел (сервер) является независимым и самодостаточным. У каждого узла свой набор ЦП...