Как избежать кризиса архитектуры AI. Avoiding a Future AI Ar — @startup_architecture

2.8Kпросмотров

29 июля 2025 г.

Score: 3.1K

Как избежать кризиса архитектуры AI. Avoiding a Future AI Architecture Crisis; What the 2025 Numbers Mean for Enterprise AI Strategy Отличная статья про будущие риски корпоративных AI-архитектур. Интересно, что её выводы сильно совпадают с нашими — хотя мы пришли к ним своим путём. Принёс вам краткие тезисы, но рекомендую прочитать статью полностью. Проблемы: — Крупнейшие AI-компании не являются устойчивыми бизнесами (например, OpenAI — убытки на 50% выручки). — Цены на AI-сервисы занижены субсидиями. Пример: Doubao от ByteDance — $0.0001 за 1k токенов (на 99.8% дешевле GPT‑4). — Потенциальный вендор-лок: архитектура, промпты, пайплайны и данные часто «зашиваются» под конкретную модель. — Энергопотребление — слон в комнате. Один запрос в ChatGPT ≈ 0.34 Втч. Общий суточный расход — ~340 МВтч (как у небольшого государства). Что делать: — Архитектурная независимость: Проектируйте с учётом независимости от конкретной модели с самого начала. Тестируйте критичные запросы на разных провайдерах. — Гибридный подход: используйте open-source модели локально для ключевых функций, а внешние API — для некритичных задач. Это позволяет объединить преимущества обоих подходов и одновременно управлять рисками. — Инфраструктура контроля: встраивайте гейтвеи для мониторинга нагрузки, затрат и энергопотребления. Это станет важным параметром SLO.

Другие посты @startup_architecture