RAG — это главное. Почему специализированные LLM реже галлюцинируют Обычные LLM чатботы подходят для разговора по душам или поиска случайных фактов в интернете, толкования снов и тому подобных вещей. Это просто смешная игрушка. Для серьёзных задач (бизнес, финансы, медицина, принятие решений) это неприемлемо. Для бизнеса галлюцинации LLM — это не «забавные ошибки», а риск: неверная цифра в отчёте, выдуманное условие договора, перепутанная дата в регламенте могут привести к самым непредсказуемым ...
BigData
Data Science : Big Data : Machine Learning : Deep Learning : LLM : Нейроннные сети По всем вопросам @evgenycarter
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
18 из 18Вы не сможете это развидеть: краткий гайд по определению LLM-текстов Но сейчас я вижу то, что я не просто не люблю, я ненавижу — нейрослоп. Это статьи, которые полны логических ошибок, не отвечает на вопрос заданный в заголовке, с кучей воды. Это не просто дно копирайтинга, это "снизу постучали". Это не было бы проблемой, будь это плохие авторы. Плохие авторы конечны. LLM может генерировать гигабайты текста, только плати за токены, и весьма недорого — у меня есть несколько проектов, в которых LL...
OMC25: Новый стандарт данных для моделирования молекулярных кристаллов Опубликован OMC25 - самый масштабный на сегодняшний день набор данных по молекулярным кристаллам, рассчитанный с использованием теории функционала плотности (DFT) в VASP. Происхождение данных Датасет базируется на траекториях релаксации кристаллов. Генерация исходных структур производилась инструментом Genarris 3.0 на основе молекул из проверенного набора OE62. Это гарантирует надежность химических структур при беспрецедентно...
LLM Council Идея этого репозитория в том, что вместо того, чтобы задавать вопрос вашему любимому поставщику LLM (например, OpenAI GPT 5.1, Google Gemini 3.0 Pro, Anthropic Claude Sonnet 4.5, xAI Grok 4 и т.д.), вы можете объединить их в свой «Совет LLM». Этот репозиторий — это простое локальное веб-приложение, которое выглядит как ChatGPT, но использует OpenRouter, чтобы отправлять ваш запрос сразу нескольким LLM, затем просит их оценить и ранжировать ответы друг друга, а в конце Председатель Со...
🏆 Топ 6 типов моделей ИИ 1. Machine Learning Models (Модели машинного обучения) - Описание: учатся на размеченных или неразмеченных данных для выявления закономерностей, классификации или прогнозирования результатов. Включают подходы с учителем, без учителя и с частичным обучением. - Примеры: деревья решений, Random Forest, SVM, XGBoost (с учителем); K-Means, DBSCAN, PCA (без учителя); Label Propagation, Semi-Supervised SVM (с частичным обучением). - Рабочий процесс: сбор размеченных данных → о...
Команды Яндекса ищут продуктовых и data-аналитиков, а также data scientists с опытом на Python от 3 лет. Участвуйте в Weekend Offer, чтобы всего за 2 дня пройти все собеседования и получить офер. Как участвовать? ⚪ Зарегистрироваться на сайте до 25 февраля. ⚪ Пройти две технические секции 28 февраля. ⚪ Познакомиться с командами и получить офер 1 марта. Мы опираемся на научные исследования и аналитические данные, а потом превращаем их в реальные продукты для миллионов пользователей. Присоединяйте...
Традиционный ИИ vs Агентный ИИ vs Агентный RAG В разговорах о развитии технологий часто смешивают понятия Традиционного ИИ, Агентного ИИ и Агентного RAG, хотя на самом деле это совершенно разные ступени эволюции. Давайте разберем их отличия простым языком. Традиционный ИИ представляет собой статичный пайплайн - классическую схему машинного обучения, с которой многие начинали. Это линейный и односторонний процесс: мы определяем задачу, собираем данные, обучаем модель, развертываем её, а затем пол...
🧠 Бесконечный контекст без дообучения? Встречайте DroPE от Sakana AI Обычно, чтобы заставить LLM работать с длинным контекстом (Long Context), приходится либо использовать методы интерполяции (как YaRN), либо проводить дорогостоящий файн-тюнинг на длинных последовательностях. Ребята из Sakana AI (те самые, что делают Evolution Merging) выпустили новый метод — DroPE (Dropping Positional Embeddings). В чем суть? Авторы заметили парадокс: позиционные эмбеддинги (например, RoPE) критически важны дл...
XLTable - OLAP Cервер для нового стека данных Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel. Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента. 📈Ключевые возможности XLTable: • Аналог MS OLAP (SSAS) для больших данных • Интеграция с MS Excel по протоколу XMLA • Поддержка ClickHouse, BigQuery, Snowflake • Скоро: YDB, Greenplum • Множество групп мер, иерархий и измерений в одном кубе • Гибкие настройки кэширования • Ра...
HunyuanImage 3.0-Instruct теперь полностью в open-source 🔥 Модель стремительно поднялась в Tier-1 глобального рейтинга Arena Image Edit и уже воспринимается как одна из самых мощных open-source Image-to-Image моделей. По сути - новый ориентир (SOTA) для всего сообщества. Что это даёт на практике: - Редактирование изображений по текстовым инструкциям на топовом уровне - Максимально точное следование промптам в духе «измени, но сохрани структуру» - Уверенный баланс качества, детализации и управля...