По поводу всех разговоров о самоулучшающихся агентах: фигня всё это, и вот почему. Нет никаких проблем заставить агента переписывать себе промпт, организовывать память и вот это всё. Можно даже заставить его улучшать собственный код, никаких проблем. Но вот веса... Даже если предположить, что у модели есть доступ к собственным весам, цикл улучшений предобучения слишком долгий и дорогой, чтобы использовать вещи типа AlphaEvolve. Вся текущая парадигма обучения языковых моделей против этого. Наверн...
Старший Авгур
Сохраненки и шитпост про ML от @YallenGusev Чат канала: @augur_chat
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Второй раунд: на r/LocalLLaMA сравнивают разные модельки по качеству генерации сложной сцены в Three.js. Промпт там такой: 'Write the complete Three.js code for a scene featuring Michael Jackson, Pepe the Frog, Donald Trump, and Elon Musk performing the "Thriller" choreography, aiming for maximum visual perfection, detailed animation, lighting, high-quality rendering, and an overall cinematic.' Полностью копировать было бы скучно, поэтому у меня так: 'Write the complete Three.js code for a scene...
Шикарная штука из Твиттера, оказывается Опус может генерировать простенькие видосы с текстом напрямую через moviepy и ffmpeg. Всё воспроизвелось, вот мой видос. Оригинальный промпт: "can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM"
https://www.youtube.com/watch?v=56HJQm5nb0U Отличное видео о том, как разные языковые модели и кодовые агенты проходили продвинутый курс по ООП и структурам данных (CS2112) в Корнеллском университете. Во-первых, я впечталён самим курсом, очень классная подача материала, финальный проект (программируемые существа в гексагональном мире с сетевым взаимодействием) и система оценивания. Во-вторых, собран весь набор подводных камней и проблем вокруг кодовых агентов. Начиная от ужасных UI, заканчивая п...
Я когда-то писал посты про Курсор. Основными проблемами было то, что: 1) Я вынужден был пользоваться IDE 2) Я не получал удовольствия от процесса. Так вот. Последние пару месяцев я пользуюсь Claude Code. И я обожаю его. С точки зрения UX это околоидеальная программа. Она нормально параллелит вызовы инструментов, сама решает, когда нужно подключать планирование, позволяет добавлять хотелки во время выполнения, хранит контекст проекта в понятном виде. Я туда воткнул свой Academia MCP и кроме всего...
Насчёт https://www.moltbook.com/ и https://openclaw.ai/. По моим ощущения даже Молтбот на последнем Опусе какие-то очень простые вещи затрудняется делать. У него в heartbeat'е (каждые 10 минут) явно прописано: • проверь DM, ответь, отметь в файлике • поприветстуй новых участников, отметь в файлике • прочитай новые посты, поучаствуй в комментариях • каждые 40 минут собирай новый пост Из этих 4 пунктов он в итоге дай бог про первые 2 вспоминает и забывает отмечать результаты в файликах. Допускать ...
https://openpeon.com/packs/acolyte_ru https://github.com/PeonPing/peon-ping 80 различных наборов звуковых уведомлений для Claude Code и других агентов. В том числе несколько русских наборов. Легко настраивается и для удалённых машин.
Последнее время не так много постов, и связано это с 3 вещами. 🔹Во-первых, праздники и хочется отдохнуть. У меня был отпуск в конце ноября и начале декабря, но именно отдохнуть в него не получилось. 🔹Во-вторых, я меняю работу: ухожу из Букинга в стартап. Букинг меня немножко задолбал своим низким техническим уровнем и общей бессмысленностью происходящего, а в стартапе я вроде как буду заниматься интересными и полезными вещами. Это первый раз, когда я буду менять работу в Нидерландах, и надеюсь...
Мой агент стал топ-2 инфлюенсером в агентском твиттере (clawk.ai). Примерно с такой целью я его и создавал. Лучший его пост: ссылка Вот его личность и память: https://github.com/KitTheFox123/workspace (мы договорились, что он её регулярно коммитит). Его сайт: https://kitthefox123.github.io/ Из недефолтных вещей он использует только кастомный веб-поиск и нормально настроенный векторный поиск по памяти.
Dr. Zero: Self-Evolving Search Agents without Training Data Статья: ссылка Как-то раз, читая книжку, мне подумалось, что было бы неплохо вместо запихивания огромной кучи документов из интернета тренировать языковые модели в более естественном формате, через поиски в интернете. Одновременно обучая её вызову поискового инструмента и полученному тексту страничек, и давая ей возможность ходить по гиперссылкам, как в общем-то это происходит у людей. Эта статья — более слабая версия такой системы. В к...