502просмотров
5 февраля 2026 г.
📷 ФотоScore: 552
Много слов про нейросети и автоматизацию процессов через них. Плотно изучая, что такое автоматизация процессов и, в частности, взаимодействие с ИИ, я довольно быстро наткнулся на кучу подводных камней и преград 🤯
Все оказалось совсем не так просто, как это рассказывают с голубых экранов мальчики и девочки с ютубчика. Во-первых, без базового понимания логики IT и принципов работы программного обеспечения сюда лучше не лезть. Во-вторых, чтобы все это реально работало, а не выглядело как красивая магия в ролике, приходится разбираться глубже и тратить заметно больше времени. Автоматизация для меня интересна сразу с нескольких сторон: 1. Создание собственного карманного ИИ-бота.
2. Мини-программы-помогайки, например транскрипбация голоса и видео в структурированный текст.
3. Сохранение музыки и видео с YouTube и других сервисов. Да, есть бесплатные и платные аналоги, но они регулярно ломаются или перестают работать.
4. Организация системы заметок на компьютере или удаленном сервере. Вплоть до сценария, когда ты отправляешь боту голосовое сообщение, а он его разбирает, анализирует и сохраняет заметку с нужным заголовком в нужном месте 🗂️
5. Обработка входящих заявок с нормальным, человеческим, а не шаблонным ответом.
6. Расчеты различных задач по заданным параметрам. Например, сколько кирпича потребуется для строительства двух стен общей площадью 50 м2, или сколько и каких проводов нужно для разводки электропроводки в квартире 70 м2.
7. И так далее. Это пока те задачи, которые я для себя наметил, бегло изучив тему. Иногда меня спрашивают, зачем вообще нужен карманный ИИ-бот, если есть современные модели, доступные бесплатно или за деньги. И тут появляется важный нюанс ⚠️ Если пользоваться нейросетями через API, то есть через программный интерфейс для межпрограммного взаимодействия, цензура в ответах обычно заметно слабее. Я с этим столкнулся напрямую. В обычном чат-окне Gemini от Google я попросил сравнить две конфигурации серверного ПО и получил отказ с формулировкой о нарушении правил. При этом ровно такую же задачу я до этого спокойно решал через Gemini CLI, то есть через доступ к нейросети из командной строки. Отдельная боль - склонность нейросетей фантазировать 🔥
Ты просишь бота сгенерировать код или команды для настройки конкретного софта. Он их выдает. Ты запускаешь, а потом час или два исправляешь ошибки, потому что часть команд или логики была изначально кривой. В итоге любую информацию от чат-бота приходится перепроверять руками. Ну и вечный вопрос, витающий в воздухе, про то, когда же нас поработят нейросети. Мой ответ простой - в ближайшем будущем не поработят 🙂
Они пока достаточно тупенькие. Более того, есть явный риск деградации. Нейросети обучаются на контенте, который раньше генерировал человек, а теперь все чаще генерируют сами нейросети. При этом около 30-40% контента они откровенно выдумывают. Кто хоть что-нибудь понял из того, что я написал, молодцы 😄