Google починил SQL Как думаете, что делает запрос ниже? FROM customer |> LEFT OUTER JOIN orders ON c_custkey = o_custkey AND o_comment NOT LIKE '%unusual%packages%' |> AGGREGATE COUNT(o_orderkey) c_count GROUP BY c_custkey |> AGGREGATE COUNT() AS custdist GROUP BY c_count |> ORDER BY custdist DESC, c_count DESC; А делает он то же, что вот этот: SELECT c_count, COUNT() AS custdist FROM ( SELECT c_custkey, COUNT(o_orderkey) c_count FROM customer LEFT OUTER JOIN orders ON c_custkey = o_custkey AND ...
DataSciencePRO
Все нужное и полезное из мира дата сатанистов)
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Коллеги, вижу что пришло много новых людейтю. Наберём нового и полезного материала) будет интересно, не переключайтесь
Коллеги, доброго дня) 3 года я веду этот канал и делюсь с вами интересными материалами с статьями. Пишу с чем сталкиваюсь в обучении, а теперь уже и по работе. Хотел бы посоветовать изучить материалы, которые мне помогли максимально быстро поднять уровень скиллов. Особенно в прогнозирования временных рядов и прочих интересных темах (например TimeGPT и тд) очень много интересных книг, думаю ни один DS или DA не может пройти мимо. https://t.me/Gewissta канал блог Артёма Груздева
PyGWalker PyGWalker — это инструмент для удобного анализа данных и визуализации в Jupyter Notebook, который превращает dataframe в интерактивный интерфейс. Пользователи могут осуществлять визуализацию, очистку и аннотирование данных с помощью перетаскивания и естественных языковых запросов. Он интегрируется с Graphic Walker и доступен на таких платформах, как Google Colab и Kaggle Code. https://github.com/Kanaries/pygwalker ================ 👁 @open_source_friend
✔️ СuML от NVIDIA: Scikit-learn на скорости GPU – без единой строчки нового кода! Все мы любим scikit-learn за его простоту и мощь. Но что если ваши модели обучаются слишком долго на больших данных? 🤔 NVIDIA предлагает решение! Вы берете свой обычный скрипт cо scikit-learn, добавляете всего две строки в начало, и он начинает работать в 10, 50, а то и 100+ раз быстрее на NVIDIA GPU! 🔥 ✨ Как это работает? Библиотека cuml от NVIDIA содержит супероптимизированные для GPU версии многих алгоритмов м...
Просто ГИГАНТСКУЮ коллекцию ИИ-агентов выгрузили на GitHub: это не просто шаблонные сервисы, а реальные, готовые к запуску инструменты. С ними можно: — Автоматизировать соцсети. — Создавать CRM-системы и базы данных. — Настраивать чат-боты. — Генерировать картинки и тексты. Забираем — ТУТ
🖥 Fireducks: Ускорь Pandas в 20 раз, изменив всего одну строчку кода! https://www.youtube.com/watch?v=3mcs_MDiLwY @data_analysis_ml
PandasGUI — графический интерфейс для работы с DataFrame PandasGUI — это удобный инструмент, который предоставляет графический интерфейс для работы с Pandas DataFrame. Он позволяет визуализировать, фильтровать и редактировать данные прямо в интерактивном окне, что делает анализ данных более интуитивным и быстрым. Python Education | #Python
🐼Сложная агрегация в Pandas с MultiIndex В новой статье на «Хабре» объясняется, как ▫️создать мультииндекс и управлять его уровнями; ▫️проводить агрегацию данных с его помощью; ▫️работать со срезами данных по уровням. 🔗 Читать статью
🐼 Pandas умирает медленной и мучительной смертью. Это самая популярная в мире библиотека обработки данных, но она медленная, и многие библиотеки значительно превзошли ее. Проблема альтернатив Pandas в том, что никто не хочет изучать новый API. Давайте посмотрим правде в глаза: люди не будут переносить свои проекты, га другие фреймворки, без особой причины. Я уже давно работаю с FireDucks 🦆 Эта библиотека в разы быстрее Pandas, и вам не придется менять код старых проектов для перехода на нее. В...