Почему не стоит злоупотреблять приведением типов в SQL запросах? #sql Наверняка любой, кто работал с sql, пользовался приведением типов и писал запросы вида: SELECT sale_id WHERE sale_time::DATE = '2024-01-01' В чем проблема такого приведения поля sale_time (datetime) к типу date? Если это поле sale_time является в таблице индексом (благодаря индексу поиск по значениям столбца происходит очень быстро), а обычно на подобные поля и делают индекс, то делая такое приведение вы лишаетесь преимущества...
IT'S DATA
Пишу про аналитику данных, читайте в закрепе чем вам может быть полезен канал!
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
15 из 15Не делал хоть раз некорректную выгрузку из-за NULL - считай не жил 😅 #sql Заметка про основные нюансы работы с NULL в СУБД. ➖Сравнение. Используйте для сравнения c NULL специальные операторы: IS NULL, IS NOT NULL. Сравнение поля с NULL через оператор равенства = всегда вернёт FALSE, т.к. даже NULL не равен NULL при сравнении через оператор равенства 😰 ➖Сравнение с отрицанием. Тут менее очевидный для новичков и более коварный случай. Используя запрос вида SELECT FROM books WHERE genre != 'Roman...
Минусы на самом деле не могу назвать это минусами, это просто нюансы, которые необходимо учитывать: - Эта книга не про обучение SQL с нуля, чтобы ее читать нужно владеть базовым синтаксисом и хотя бы небольшим кол-м практики. Интересно совпало, но автор и я рекомендуем одну и ту же книгу для изучения SQL с нуля: SQL за 10 минут, Бен Форта. Если вы только начинаете, советую ограничиться первыми 14-ю главами. - Некоторые темы в книге покрываются поверхностно, но в этом нет ничего удивительного или...
#ChatGPT С создания канала не было ни одного поста про ChatGPT, о нём и так трубили отовсюду и создавалось ощущение, что абсолютно каждый уже попробовал его на деле, знает что это и чем он может быть полезен именно ему. На деле это лишь когнитивное искажение при котором вы переоцениваете осведомлённость людей вокруг о чем-либо, у этого даже есть термин: проклятие знания. Но вернёмся к ChatGPT, начнём с простого: официальный сайт. На нём можно абсолютно бесплатно пользоваться ChatGPT версии 3.5, ...
#visualization #tableau Сегодня поговорим про Top N и подход к визуализации в целом. Top N - визуализация для представления наиболее значимых элементов набора данных, исходя из выбранной нами меры сравнения. В бизнесе это может быть топ продуктов по кол-ву продаж, в анализе соц. медиа - топ хештегов, в seo - топ ключевых слов, привлекающих трафик, и так далее. Как выбрать N и понять нужно ли вам вообще показывать топ? - Подумать о цели анализа, что вы хотите показать? Например, если у вас магази...
Как вам идея хранить все данные для аналитики в одной таблице? Activity Schema - концепция организации хранилища данных именно таким образом. Как видно на изображении, изначально у нас как обычно много таблиц-источников, которые мы складываем в один "стрим" (по сути это обычная таблица), а его используем для чего душе угодно: в качестве источника для BI-инструмента, для разовых выгрузок и прочего. Основа любого стрима это метка времени, сущность (например, пользователь) и активити, т.е. название...
Могут ли сейчас GPT генерировать корректный SQL? #sql #ChatGPT Увидел новость про новую версию модели для генерации SQL запросов - Sqlcode 8b, которая в этой задаче якобы бьет даже GPT 4. Стало интересно посмотреть так ли все хорошо и вот результаты. Для теста взял довольно простое тестовое задание, однако, GPT 3.5 с ним не справляется. Звучит оно так: Напишите SQL запрос, который бы вернул список клиентов, сумму их покупок и телефон, если они соответствуют условиям: - Первая покупка была соверш...
Недавно дочитал книгу SQL для анализа данных, в этом посте отзыв после прочтения которого у вас сложится понимание нужна ли книга конкретно вам. Плюсы: - Начну пожалуй с самого большого и очевидного: эта книга про SQL конкретно для аналитиков, а таких книг на самом деле очень мало. Полно книг для администраторов баз данных или разработчиков, но контекст использования SQL в них совершенно другой. Эта книга не просто про SQL, попутно она затрагивает продуктовые метрики, немного статистики и пр. - ...
#BI Время летит, Superset развивается, и если несколько лет назад это был довольно сырой продукт, не выдерживающий конкуренции при сравнении с теми же Tableau/Power BI, то сейчас это вполне зрелое решение, которое внедряет всё больше компаний, в их числе, например: Сбер, ВкусВилл, Леруа Мерлен и многие другие. Прямо сейчас на hh есть ~500 вакансий по запросу superset. Кстати, если вы не знаете что такое BI-инструменты в целом, то у меня был пост на эту тему. Так вот, совсем недавно была выпущена...
Как и зачем генерировать временной ряд в SQL? #sql Сразу простой пример для понимания о чем речь: SELECT report_date FROM generate_series( '2024-01-01', CURRENT_DATE-1, INTERVAL '1 day' ) AS report_date Данный запрос в postgresql вернёт таблицу со списком дат с начала года до вчерашнего дня: +-------------+ | report_date | +-------------+ | 2024-01-01 | | 2024-01-02 | | 2024-01-03 | | ... | +-------------+ Два основных случая когда это может понадобиться 1️⃣ Заполнение пропусков. Вы делаете выгр...