Чатек привет. Хочу закинуть одну мыслю/вопрос к вам в голову — @xavescor_code

1.7Kпросмотров

29 января 2026 г.

Score: 1.8K

Чатек привет. Хочу закинуть одну мыслю/вопрос к вам в голову. Мне кажется, что современные агенты для написания кода разрабатывают не программисты, а кто-то другие. Учёные там, дата сайентисты или кто-то ещё. За всё это время жизни с агентами я понял, что мой сценарий работы, как и фичи, нужные мне для этого, переиспользуются вне зависимости того каким агентом я пользуюсь. И примерно все агенты движутся к примерно одному интерфейсу и функциональности. Однако всё это движение идёт в сторону "ща появится новая модель, которая будет делать всё как надо и будет самой-самой". И даже тут в канале на некоторых постах, где я говорю: мне нужна такая-то встроенная фича(к примеру, иерархичный agents.md), то мне предлагают переложить эту задачу на модель, а не на промпт. Я же вижу развитие в чутка другой стороне: мы УЖЕ имеем достаточно умные мыслящие модели. Единственное что им не хватает - это интеграция с уже существующими тулами. Потому что мы вне зависимости от проекта, языка программирования, компании и других изменяемых параметров действуем примерно одинаково: 1. У нас есть задачи 2. У нас есть разные верификаторы: линтеры, форматтёры 3. У нас есть тесты 4. У нас есть девтулы к рантаймам: как дебаггеры у уровне точек останова, так и всякие приспособы к браузерам, чтобы дебажить веб и так далее. И вот почему, к примеру, не научить агенты нормально писать тесты? Опишу что мне надо: а) чтобы агент знал о всех тестовых системах. ЭТО ВОЗМОЖНО. Это УЖЕ делает jetbrains. Их не бесконечное количество. Для веба это всего лишь jest, vitest и возможно парочка устаревших систем. Причём спасибо эволюции, эти системы похожи на 99%. Отличие только в мелочах. Для браузеров это playwright, cypress и может быть puppeteer. Кроме того надо обеспечить гранулирование тестов по какому-то признаку, чтобы файлы были небольшими и ЛЛМка могла их читать полностью, а не вырезать куски строками. Плюс неплохо было бы переделать форматтёр, чтобы ллмке не выдавался всякий мусор по типу "успешных 100500 тестов". В итоге получаем такой пайплайн: 1. Вы работаете как работается 2. ЛЛМка отрапортовала, что работа над задачей завершена. 3. Агент сам без участия ЛЛМ(помните же что мы умеем писать код, который выполняется как написан) прогоняет все тесты. Т.е. мы не просим "запусти тесты". Мы видим что установлен vitest и понимаем, что запуск необходим. Если что-то упало, то то идём к ЛЛМ и говорим: я сделал 30 тудушек на каждый из упавших тестов. Первая тудушка такая, выполняй. И так в цикле. В данный момент мне приходится всё это костылить руками, потому что агентам нужно в первую очередь похвастаться что они научились новую кнопочку в терминале рисовать б) работа с рантаймом. Иногда надо уметь дебажить код. И тут такая же фигня. У нас есть ограниченное число рантаймов: нода, бан, дено, jvm, clr и так далее. И они работают тоже одинаково с точки зрения внешнего наблюдателя. Т.е. с точки зрения ЛЛМ. Все умеют в точки останова, все умеют в сборку мусора, все умеют в снепшоты памяти. Почему не сделать 10-15 частных интеграций под каждый из рантаймов как ЭТО УЖЕ СДЕЛАЛА JETBRAINS? В чём проблема? Почему мне опять приходится костылить через эти скиллы с надеждой, что ЛЛМ поймёт что я хочу? У нас уже есть детерменированные интеграции. Почему просто не переиспользовать то что мы уже делаем для людей? в) В некоторых языках вообще халява: там только 1 фреймворк и 1 господствующий подход, который покрывает 95% людей/кода/проектов. В джаве это Spring, в дотнете это ASP.NET, в Angular - это, внезапно, ангуляр. И так далее. Где-то во фронте есть стандартизация роутеров и т.д. И, не поверите, ЭТО ОПЯТЬ ЖЕ ВСЁ УЖЕ СДЕЛАЛА JETBRAINS. Одна компания. И так далее и тому подобное. И вот у меня вопрос: это я такой дебил и не вижу чего-то принципиального что мешает переиспользовать человеские интеграции в ЛЛМ или что вообще происходит? Я виду только 1 компанию, которая делает то что я описал - это cursor. И то их попытка окончилась на робкой интеграции браузера, а дальше они не пошли

Другие посты @xavescor_code