A
adapt compete evolve or die
@abacabadabacaba4041.1K подп.
5.2Kпросмотров
10 ноября 2025 г.
Score: 5.7K
Интересная штука https://www.limix.ai/ попытка построить универсальную модель для структурированных (табличных) данных. Идея как в LLM, только вместо языка у нас много-много реальных и синтетических табличных данных для претрейна. В итоге вместо обучения модели с нуля на собственных табличных данных, мы делаем файн-тюн. Ключевые идеи, которые я уловил: 1) Context-Conditional Masked Modeling мы рассматриваем несколько строк таблиц как контекст и несколько фич из определенной строки как запрос. Пытаемся восстановить замаскированные фичи. В результате получаем обучение на совместное распределение. Что тут таргет - вообще не особо важно, модель учится заполнять пропуски во всех фичах. 2) Модель основана на трансформере, отдельный аттеншн по строкам и столбцам. Вместо позиционного кодирования в LLM тут кодирование колонки (признака), чтобы модель понимала где мы что замаскировали. Эмбединг просто добавляется к значению признака. 3) На этапе предсказания у нас довольно большой выбор что использовать в качестве контекста (можно запихать кучу строк трейна), lumix отбирает по атеншну наиболее важные строки из него и делает предсказание только из них. Своеобразный дата-селекшн вместо feature selection. В статье еще много про то как они синтезировали данные и почему это работает (по их мнению), но это я подробно читать не стал, хотя там много интересного. Из практического: проще всего модель из докера запускать, но сходу что-то у меня не очень завелось, разумного вида трейн передать туда не удается, он разбухает в памяти раз в 100. Но забавно что даже довольно маленький трейн дает не рандомный результат (хотя и слабый, и да xgb даже такой не вытащит из этого трейна). Короче, возможно, это работает, но железа нужно очень много
5.2K
просмотров
1751
символов
Нет
эмодзи
Нет
медиа

Другие посты @abacabadabacaba404

Все посты канала →
Интересная штука https://www.limix.ai/ попытка построить уни — @abacabadabacaba404 | PostSniper