прикольно дизайнить процессоры агентами Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU https://arxiv.org/abs/2603.08716 https://www.alphaxiv.org/ru/overview/2603.08716
Агенты ИИ | AGI_and_RL
Про ии, RL и в целом @tokarev_i_v https://t.me/researchim
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
17 из 17ребятки, новые квены 3.5 получились отличные. респект квенам отдельное спасибо OpenAI, Anthropic, Google за такие крутые модельки. эти компании со своими фронтирами для того и нужны чтобы были у нас крутые квены щас локально работаю с 35b и 9b в q4 - все классн я вообще думаю что через 1-2 подобных релизов у нас мб будет прям опус 4.6 дома для меня всегда чисто локальные модельки были важнее любых крутых внешних. но вот до недавнего времени вменяемых по размеру моделек для локала не было. и тк щ...
Напоминаю проект который я сейчас развиваю - про студию модельки дома где вы можете заняться тюном небольших ллмок ллмок с 0 до sft и grpo (главное чтобы ну карточка хотя бы гигов 12 была) есть поддержка lora, qlora (для sft и grpo) https://github.com/researchim-ai/models-at-home есть предустановленные наборы данных которые можно выкачать сколько вам надо и поставить тюн а можно и с HF выкачать модельки и потюнить несколько пресетов для моделек тоже есть поддерживаются и несколько gpu там приеха...
там кстати челы выложили датасеты которые использовали для трена Goedel-Prover-V2 - модельки для доказательств теорем выходила моделька и статья в августе 2025 сама папир Goedel-Prover-V2: Scaling Formal Theorem Proving with Scaffolded Data Synthesis and Self-Correction https://arxiv.org/abs/2508.03613 https://www.alphaxiv.org/ru/overview/2508.03613 моделька https://huggingface.co/Goedel-LM/Goedel-Prover-V2-32B сеты SFT (1.74M samples) https://huggingface.co/datasets/Goedel-LM/SFT_dataset_v2 RL ...
https://openai.com/index/introducing-gpt-5-4/ квен 4 хороший будет
https://voxelbench.ai/compare бенч моделек на генерации всякого из кубиков довольно прикольно выглядит можно пооценивать и полюбоваться
приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас кстати кодексом 5.3 я доволен
ребятки, новые квены 3.5 получились отличные. респект квенам отдельное спасибо OpenAI, Anthropic, Google за такие крутые модельки. эти компании со своими фронтирами для того и нужны чтобы были у нас крутые квены щас локально работаю с 35b и 9b в q4 - все…
Подписчики я ни на что не намекаю, но... Для рля бы пошло, чисто mountaincar на флажочек закатить https://www.techpowerup.com/344840/asus-showcases-expertcenter-pro-et900n-g3-at-ces-2026
а вот это прикольное применение опенклав Most RL-for-LLM systems assume centralized, batch-mode training with pre-collected datasets. OpenClaw-RL takes a fundamentally different approach: it wraps your self-hosted model in OpenClaw as an OpenAI-compatible API, intercepts live multi-turn conversations, and continuously optimizes the policy in the background — all without interrupting your usage. https://github.com/Gen-Verse/OpenClaw-RL напомню что у нас есть штука для тех кто хотел бы сам тюнить ...