📦 Python пакет для TabM Небольшая новость для тех, кто следит за DL для табличных данных. Мы тут выпустили Python пакет для TabM — нашей tabular DL архитектуры, о которой я рассказывал раньше. С момента анонса TabM прошел проверку практикой, и если в одном предложении, то TabM значительно усилил нишу практичных бейзлайнов в табличном DL. То есть взять TabM и получить хорошие результаты люди смогли в самых разных контекстах: и на Kaggle, и на масштабе 100M объектов, и в академических исследовани...
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20🚀 TabM: новая DL архитектура для табличных данных Новая большая статья по tabular DL при моем участии! Ссылки в конце поста. Для практиков, TabM — это новый ответ на вечный вопрос: “Какую современную табличную архитектуру попробовать?”. На этот раз SOTA на бенчмарках простая, практичная и машстабируется на миллионы объектов. Для области, TabM — это история о том, как сделать лучше, проще и дешевле одновременно. И как показать это на красивых информативных графиках 💅 Для любителей ML, TabM — эт...
uv — очень быстрый pip на стероидах с большими абмициями Пост будет особенно полезным, если раньше не сталкивались с pip-tools. В конце есть пример испольвания. uv — это новый и полезный уже сейчас инструмент от компании Astral, которая раньше сделала Ruff. Долгосрочная цель авторов очень амбициозная -- сделать uv единым инструментом для работы с Python и заменить все отдельные инструменты: pip, pyenv, virtualenv, pip-tools, ruff, tox, pipx, и т.д. В итоге любой инженер, аналитик, исследователь ...
В нашу редакцию поступила обратная связь от топ-4 мирового рейтинга Kaggle
TabR — новая нейросеть для табличных данных Finally, анонс нашей статьи: "TabR: Unlocking the Power of Retrieval-Augmented Tabular Deep Learning"! Я там первый автор, но конечно это командная работа. 🙂 ПЛАН ПРЕЗЕНТАЦИИ 🙃 1. основные ссылки в этом посте ниже 2. ТЕХНИЧЕСКИЙ РАЗБОР СТАТЬИ — В КОММЕНТАРИЯХ К ЭТОМУ ПОСТУ (клик) 3. следующий пост — нетехнический комментарий об области в целом. Ссылки: - Статья - Код - Тред в Twitter с обзором модели и результатов - Пост на Reddit P.S. Картинка показ...
Оптимизатор Muon добавили в PyTorch Тут вышел PyTorch v2.9: https://github.com/pytorch/pytorch/releases/tag/v2.9.0 Для меня главный хайлайт релиза — это torch.optim.Muon. Если знаете про Muon, то новость на этом всё :) Если не слышали про Muon, то это такой оптимизатор, который согласно легенде появился в 2024 году в результате дискуссий на сайте икс-точка-ком. Официальной "статьей" про Muon является этот пост: https://kellerjordan.github.io/posts/muon. У Muon уже есть истории успеха на бенчмарк...
🎉 Zed на Linux 🎉 Добрая летняя новость: текстовый редактор Zed стал доступен на Linux: https://zed.dev/download На Windows все еще не доступен. Я когда-то писал про Zed, стабильно использую его как открывашку для файлов и репозиториев для чтения и быстрых правок. Но remote development все еще нет. @simple_it_channel
СОВЕТ ДНЯ: красивые Matplotlib графики в одну строчку Как в одну строчку увеличить разрешение Matplotlib графиков, чтобы они наконец стали красивыми, а не мыльными: # In Jupyter, after imports: %config InlineBackend.figure_format='retina' # Or: import matplotlib_inline matplotlib_inline.backend_inline.set_matplotlib_formats('retina') Как быстро попрововать с компа? (лучше на мониторах с высоким разрешением) Способ 1: Colab тетрадка: link Способ 2: Я как-то писал про JupyterLite, просто идем по с...
Задачи на табличных данных Это нетехнический краткий пост про саму область анонсированной статьи, можно смело пропускать если знаете. Упрощая, исследуя нейросети для табличных данных, люди стремятся не к получению штучных сложных результатов (о которых мы обычно слышим, в духе “обыграть человека в шахматы” или вот ChatGPT), а к улучшению существующих решений на огромном числе задач “попроще”, и туда входит действительно миллион всего: от прогноза погоды на завтра и рекомендации фильмов до класси...
pylock.toml — новый стандарт локфайлов в Python Вчера был одобрен эпический PEP 751, который вводит стандартный формат локфайлов в Python. Несколько лет дизайна, итераций и обсуждений, почти тысяча лайков на Reddit у этой новости, в общем большое событие. Если вы знаете, что такое локфайлы, то новость на этом заканчивается. Называться будет pylock.toml, теперь ждем пока все инструменты постепенно на него переедут. Если не знаете, то lockfile -- это просто текстовый файл определенного формата с п...