325просмотров
46.0%от подписчиков
27 марта 2026 г.
questionScore: 358
Попадалась ли вам новость, что «нейросети оказались неспособны поддерживать долгосрочную эволюцию кодовой базы»? Если нет, то кратко суть: 🔴Alibaba Group разработали SWE-CI – тест для проверки качества поддержки кода
🔴Большинство моделей этот тест завалили (Claude был лучше всех) Новость важна тем, что это первый тест для AI моделей, который проверяет не как модель пишет код с 0, а как его поддерживает. Это приведет к тому, на мой взгляд, что конкурирующие модели будут закрывать эту дыру в своих решениях, так как крупным корпорациям важнее не сколько написать новое, а сколько поддерживать и развивать уже написанное. А за этих клиентов конкурирующие модели готовы бороться. Поэтому качество моделей только вырастет. Ссылка на само исследование Как вы думаете, какие шансы у Гига Чада пройти этот тест и на каком месте он окажется? #реакция #мнение Подписывайся на канал и погружайся в пучину знаний с IT Удильщиком!