9.1Kпросмотров
98.4%от подписчиков
6 марта 2025 г.
question📷 ФотоScore: 10.0K
🤖 Помните писал про AI агентов, которые будут управлять компьютером? Так вот они уже здесь и одного из них удалось даже протестировать. Задачу можно поставить в одно предложение, а нейросеть сама раскладывает на шаги и выполняет нужные действия в браузере. На скриншоте одно из лучших на сегодняшний день решений - Browser Use, пока это не управление компьютером, но уже управление браузером. Логика работы следующая:
🟠Запускается браузер, команда пользователя разбивается на этапы
🟠Далее либо через поиск, либо через заход сразу на сайт происходит взаимодействие
🟠Нейросети отдается текущая страница через список элементов с номером
🟠В зависимости от текущего действия она принимает решение на какую из кнопок нажать Звучит так, что это очередной прорыв, но в реальности есть много скользких моментов:
🟠Каждый шаг ест приличное количество токенов
🟠При попытке запустить на простой модели - всё ломается (жмёт не туда, делает не то, ...), более менее работает на последних и предпоследних моделях
🟠Поп-ап бывает преградой, а всплывающих окон на сайтах реально много
🟠Промахнувшись нейросеть не понимает что делать дальше, потому что ни одна из кнопок не позволяет продолжить решать задачу Если заинтересовало:
💬Протестировать без установки - operator.browserbase.com
📥Запустить локально без ограничений - github.com/browser-use/browser-use