Ддата инженеретта

дата инженеретта

@data_engineerette💻 Технологии🇷🇺 Русский📅 март 2026 г.

мелкое — крупно, в глубоком разговоре мудрость приходит по вопросам сюда: @aigul_sea

📊 Полная статистика📝 Все посты
🔗 Связанные:@selectel_events
3.2K
Подписчики
2.2K
Ср. охват
66.4%
Вовлечённость
16
Постов
~0.3
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

16 из 16
Ddata_engineerette
data_engineerette
16 февр., 17:21

Худшие фейлы в DE Наткнулась на тред в реддите, где обсуждались фейлы на работе. Мне больше всего зашли 2 истории, они такие смешные и страшные одновременно🤯 1️⃣Стриминг писал в то же самое место, откуда и читал. Это все длилось год, поэтому накопилось сотни триллионов миллиардов версий документов. Проблема обнаружилась, только когда к ним пришел AWS и пожаловался на проблемы в своих системах Неужели за этот год они не заметили, как эти пайплайны работают все медленнее и медленнее, почему такая...

👁 4.5K
Ddata_engineerette
data_engineerette
5 мар., 14:29

Iceberg — это must have? Вы еще не замечали, что становится больше вакансий, где айсберг уже требуют? С одной стороны, если посмотреть на hh, то вакансий с айсбергом всего около 5%. Но, с другой стороны, в последнее время на меня выходят именно с формулировкой обязательности Собрала список компаний, которые хотя бы частично уже живут на Data Lakehouse: 📌Ламода 📌Магнит 📌Альфа 📌М.Видео 📌МТС 📌Сбер 📌X5 📌Лента 📌Золотое яблоко (Delta Lake) А вот Озон по состоянию на прошлый год планировал идт...

👁 3.2K📷 photo
Ddata_engineerette
data_engineerette
14 мар., 15:35

AI-эра 🤵 Я последние пару недель жестко подсела на видосы с фаундерами, CEO на тему бизнеса и AI. Все началось с поста про интервью с основателем Revolut Николаем Сторонским. Дальше мне захотелось узнать мышление других мировых лидеров, и пошло-поехало В основном, на подкастах обсуждают, что нас ждет в 2030, 2035, 2040. Но уже в этом году прогнозируют, что появится AGI - Artificial General Intelligence. Если не в этом, то точно в следующем. Он будет умнее всех нас. К 2100 году один из экспертов...

👁 2.7K📷 photo
Ddata_engineerette
data_engineerette
27 февр., 07:51

pre-commit Про эту штуку мне рассказал наш девопс. Короче, можно настроить у себя на ноуте, чтобы перед каждым коммитом прогонялись линтеры, форматтеры, другие легковесные чекеры Шаг 1. В корне репки создаем файлик .pre-commit-config.yaml и добавляем нужные модули: repos: - repo: https://github.com/sqlfluff/sqlfluff rev: 4.0.4 hooks: - id: sqlfluff-fix args: [ --config, tables/.sqlfluff ] Шаг 2. Устанавливаем pre-commit brew install pre-commit pre-commit install Все хуки лежат в папке .git/hooks...

👁 2.5K
Ddata_engineerette
data_engineerette
20 февр., 13:50

max_by/min_by Узнала про прикольные функции, они заменяют оконку/CTE на одно поле Пример - вывести имя сотрудника с максимальным стажем по каждому департаменту result = df.groupBy("department").agg( F.max_by("name", "years") ) И все! Не надо никаких row_number = 1 В Spark SQL можно еще и фильтр набросить: spark.sql(""" select department, max_by(name, years) filter (where name is not null) from employees group by department """) А в Trino еще можно собрать массив топ-n в убывающем порядке: select...

👁 2.5K📷 photo
Ddata_engineerette
data_engineerette
2 мар., 07:10

AI в OpenSource 🤓 У нас была проблема: аналитики переписывают свои скрипты с синтаксиса Trino на Spark, и в DDL они постоянно забывают поменять varchar на string. В итоге скрипты падают, только когда уже все вмержено в мастер (не круто) Линтер при этом не отлавливал такие кейсы, потому что varchar в диалекте спарка тоже существует, но с указанием длины: varchar(10) 🤔 Я покопалась в коде линтера, нашла проблему и завела issue на гитхабе Через 2 недели приходит отбивка, что все сделано. Я смотрю...

👁 2.4K
Ddata_engineerette
data_engineerette
12 февр., 10:23

Подъехала задачка! На картинке a, b - исходные таблицы, res - итоговая Нужно написать один запрос, который вернет нужный результат в обоих случаях @data_engineerette

👁 2.2K📷 photo
Ddata_engineerette
data_engineerette
18 февр., 16:01

Когда работаешь с айсбергом, но есть нюанс

👁 2.1K📷 photo
Ddata_engineerette
data_engineerette
13 февр., 19:56

Откуда у них доступ к моему Airflow

👁 2.1K📷 photo
Ddata_engineerette
data_engineerette
24 февр., 07:35

Влияние ИИ на маркетинг 🔝 Раньше бренды пытались быть в топе выдачи в поисковике, участвовали в аукционах, чтобы выбить себе первые места Когда я работала в маркетинге, наши аналитики очень часто обсуждали органический трафик. Это пользаки, которые перешли на сайт из поиска, а не рекламного баннера. Помню, как они заходили в браузер с разных устройств и с инкогнито, чтобы перепроверить актуальную позицию. Мы парсили запросы по ключевым словам с упоминанем бренда и без, и это все мониторилось на...

👁 1.9K📷 photo

Типы хуков

Нейтральный13 | 2.3K просм.
Вопрос3 | 1.7K просм.

Длина постов

Длинные (500-1000)7 | 2.3K просм.
Очень длинные (1000+)5 | 2.1K просм.
Короткие (<200)4 | 1.9K просм.

Влияние эмодзи

2.1K
С эмодзи (8)
2.2K
Без эмодзи (8)
-7.9% охвата

Типы контента

📝
5
text
2.6K просм.
📷
11
photo
2.0K просм.
дата инженеретта (@data_engineerette) — Telegram-канал | PostSniper