TurboQuant: оптимальное устранение оверхеда при векторной квантизации KV-cache Google представил TurboQuant (ICLR 2026) — алгоритм сжатия высокоразмерных векторов, который решает фундаментальную проблему: при классической векторной квантизации для каждого блока данных нужно хранить константы квантизации в полной точности. Это добавляет 1–2 бита на элемент, частично нивелируя выигрыш от сжатия. TurboQuant оптимально минимизирует этот оверхед, используя два вспомогательных метода: — Quantized John...
AI Железо — GPU | TPU | Роботы | Чипы
100+ AI-источников → железо для AI. GPU, TPU, чипы, роботы — новинки и аналитика. Вопросы: @aiskladadmin
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Мораторий на дата-центры свыше 20 МВт: детали законопроекта Сандерса — Окасио-Кортес В Конгресс США внесён законопроект о запрете строительства новых дата-центров с пиковой электрической нагрузкой свыше 20 МВт. Порог выбран не случайно — он отсекает практически все новые площадки гиперскейлеров (типичный кластер для обучения LLM потребляет 50–150 МВт), при этом не затрагивает edge-объекты и небольшие корпоративные ЦОД. Ключевые технические последствия в случае принятия: — Экспорт чипов: запрет п...
AI-наушники Яндекса «Дропс» обнаружены в московском метро Пользовательница сети X нашла на станции «Театральная» ранее не представленные в продаже наушники «Дропс» от Яндекса — первое носимое устройство компании со встроенным ИИ. Ключевая функция устройства — «Моя память», подробности о которой пока не раскрываются. Судя по утечке, наушники находятся на этапе финального тестирования. Яндекс подтвердил ТАСС, что устройство готовится к выходу: дату старта продаж обещают объявить в ближайшее время....
8-канальный носимый обонятельный дисплей: архитектура и принцип работы В публикации IEEE инженеры Токийского научного института описали компактное устройство для генерации запахов, монтируемое на VR-гарнитуру. Архитектура основана на аддитивном синтезе: 8 независимых резервуаров с базовыми одорантами, каждый с управляемой подачей. Смешивание происходит в воздушном потоке, направленном в назальную зону пользователя. Принцип аналогичен RGB-модели — конечное число базисных компонентов формирует шир...
On-device рекомендательный движок Яндекс Музыки: 100 КБ, офлайн-инференс Яндекс Музыка развернула рекомендательную систему непосредственно на пользовательских устройствах. Архитектура заслуживает внимания с точки зрения edge AI. Вместо квантизации и дистилляции серверной нейросети команда пошла другим путём: на устройство устанавливается лёгкий движок весом 100 КБ, а не модель. При синхронизации сервер передаёт персонализированные параметры подбора — фактически предвычисленные веса для конкретно...
Модульная метамашина: адаптивная локомоция на проприоцептивных датчиках без внешней обратной связи Северо-Западный университет опубликовал исследование модульного робота с адаптивной локомоцией. Архитектура модуля: шарнирная сфера с двумя звеньями, одна степень свободы — вращение на 360° вокруг единственной оси. Внутри сферы — батарея, печатная плата с вычислительным блоком, датчиками и модулем связи, а также привод. Один модуль реализует три базовых паттерна движения: качение, вращение на месте...
Автономные микророботы без CPU: электрокинетика vs пневматическая самосинхронизация Два исследования с принципиально разными подходами к безпроцессорному управлению движением. Penn/Michigan — электрокинетический микроробот Габариты: 200 × 300 × 50 мкм (толщина в ~10 раз меньше волоса). Изготовление — стандартный полупроводниковый процесс на кремниевых пластинах. Себестоимость ~1 цент. Бортовая электроника: микрочип, температурные сенсоры (разрешение 0,33°C), фотоэлектрические панели мощностью 75...
OpenClaw: как Nvidia строит полный стек для воплощённого ИИ На GTC Nvidia представила стратегию OpenClaw — вертикальную интеграцию от кремния до облачного инференса, нацеленную на робототехнику. Архитектура стека: 🔧 Аппаратный уровень — чипы + референс-дизайны для edge-развёртывания 🔧 Платформа симуляции — Isaac Sim на базе Omniverse для обучения и тестирования манипуляторов в виртуальной среде до деплоя на физическое железо 🔧 Программный слой — CUDA-платформа + открытые интерфейсы для роботи...
DDR4 8 ГБ: рост цены в 8,8× за год на фоне перераспределения DRAM-мощностей По данным Nikkei Asian Review, с февраля 2026 года спотовые цены на модули DDR4 8 ГБ выросли в 8,8 раз. DDR5 также дорожает, но динамика значительно мягче. Корень проблемы — перераспределение производственных мощностей. Samsung, SK Hynix и Micron сокращают линии DDR4/LPDDR4 в пользу HBM и высокоскоростных модулей для ИИ-кластеров. Результат: — Доступность DDR4 упала до ~50% от спроса — Часть вендоров прорабатывает fallba...
Agile Robots интегрирует Gemini Robotics от Google DeepMind в промышленных роботов Agile Robots и Google DeepMind объявили о стратегическом партнёрстве с двусторонним обменом: foundation-модели Gemini Robotics встраиваются в роботов Agile, а полевые данные с роботов возвращаются для дообучения моделей. Это замкнутый цикл «модель → развёртывание → данные → улучшение модели». Контекст по Agile Robots: — Основана в 2018, штаб-квартира в Мюнхене — 20 000+ развёрнутых решений в промышленности — $...