23 октября, чт, в 17 00 (gmt+3) Александр Червов (Институт Кюри) выступит на семинаре Центра практического искусственного интеллекта Сбера (Sber AI Lab) с рассказом о библиотеке CayleyPy и статье по ней CayleyPy — библиотека на базе ИИ для теории графов и групп (NIPS 2025 Spotlight) Будут представлены новые ИИ-подходы для задач классической теории групп и графов, которые значительно превосходят существующие системы компьютерной алгебры по производительности. С помощью библиотеки предложено около...
Хроники ботки
Пишу интересные вещи, с которыми сталкиваюсь по работе над диссером (обобщение keypoints detection с помощью дифференциальной геометрии) и работой над работой (ML и матстат в основном) Вопросы и т.п. писать в чат или @shpacman
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
14 из 14🚀 @SBERLOGASCI webinar on mathematics and data science: 👨🔬 Sergei Gukov "What makes math problems hard for reinforcement learning: a case study" ⌚️ 19 September, Thursday 19.00 Moscow time Add to Google Calendar Can AI solve hard and interesting research-level math problems? While there is no mathematical definition of what makes a mathematical problem hard or interesting, we can provisionally define such problems as those that are well known to an average professional mathematician and have...
Метод Общий фреймворк выглядит следующим образом: ▶️ Функция преобразования данных f_X (X - входные данные) ▶️ Функция конструкции смешивающей матрицы f_M L x L, которая может быть постоянной или зависеть от входов ▶️ Результат sequence mixing имеет вид f_M(f_X (X)) Далее авторы вводят термин Sequence Aligned Matrices (SAM, еще один… 🥱) означающий, что матрица смешивания зависит от входных данных. Такие sequece миксеры хороши с одной стороны тем, что более адаптивно подстраиваются под входы, и,...
#книга Каждая книга — кража у собственной жизни. // Марина Цветаева И ещё одна моя книжка... когда-то я придумал игру для студентов "Что здесь изображено?". В последний год довольно много взаимодействовал со школьниками, им она тоже "зашла", как и учителям. Меня спросили, есть ли какой-то сборник заданий по этой игре... пришлось его срочно составить.
#видео Доклады прошлого года семинара "Математические основы искусственного интеллекта", который проводит Математический институт им. В.А. Стеклова. Выложены записи выступлений Бурнаева, Гасникова, Ветрова, Наумова, Оселедца, Разборова и многих других. https://www.mathnet.ru/conf2402 П.С. Рисунок взят из доклада Димы Ветрова, когда он объясняет, как попадать в широкие минимумы функций потерь.
Нашу статью взяли на NeurIPS 2025! arxiv:2502.13266 Статья "A Machine Learning Approach That Beats Large Rubik's Cubes" про то как находить путь на больших графах в принципе, и про то как with zero human knowledge собирать Кубик Рубика 3x3, 4x4, 5x5, пятнашки до 6x6, ... и другие перестановочные пазлы в частности. Для понимания масштаба: кубик 5x5 это 10⁷⁴ состояний, а мы там находим достаточно короткий (лучший из опубликованных) путь сборки. Код к статье доступен на git cayleypy-cube. Забавно ч...
В середине июля в Лондоне прошла летняя школа, для аспирантов и пост-доков - LOGML (London Geometry and Machine Learning). Тематика школы - применение методов геометрии и топологии в глубинном обучении, организатор Imperial College London. В 2021 и 2022 годах она была онлайн, в этом году все сделали очно. Направление школы идеально совпадает с темой моей диссертации, я участвовал в школе во все прошлые итерации, и в этот раз решил провести незабываемую неделю в Лондоне, работая над релевантным м...
Hydra: Bidirectional State Space Models Through Generalized Matrix Mixers [Статья][Код] Современные нейронные сети, обрабатывающие пространственно-временные данные различной природы будь то текст 📝, изображения 📷, аудио 🎵 и видео 📹 так или иначе обладают механизмом перемешивания каналов (channel mixing), обрабатывающим независимо признаки для каждого элемента последовательности, и механизмом обработки последовательности (sequence mixing), использования взаимосвязей между элементами. В сегодн...
В своей работе "Теорема о невозможности кластеризации" Клейнберг доказывает что никакой алгоритм кластеризации не может удовлетворять одновременно трем названным условиям. Масштабная инвариантность нарушается когда для определения принадлежности точки к кластеру используются относительные расстояния с заданным порогом. Насыщенность нарушается, если заранее фиксируется количество кластеров. Согласованность нарушается когда для объединения точек в кластеры используются абсолютные расстояния не пре...
Желание разложить что-угодно по группам на основе схожести - естественная черта человека, но задача кластеризации данных, почти всегда как плохое ТЗ для дизайнера - делай красиво, а не красиво не делай. Какой алгоритм кластеризации хороший, а какой плохой если сравнивать результат их работы не с чем? Джон Клейнберг из Корнеллского университета в 2002 году сформулировал три критерия хорошего алгоритма кластеризации: - Масштабная инвариантность. Если все расстояния между точками умножить на положи...