BBigData

BigData

@bigdata_1💻 Технологии🇬🇧 English📅 март 2026 г.

Data Science : Big Data : Machine Learning : Deep Learning : LLM : Нейроннные сети По всем вопросам @evgenycarter

📊 Полная статистика📝 Все посты
##ai#llm#sakanaai#longcontext#research#agents#opensource#devtools
3.3K
Подписчики
884,944
Ср. охват
26.9%
Вовлечённость
18
Постов
~0.1
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

18 из 18
Bbigdata_1
bigdata_1
27 дек., 19:15

RAG — это главное. Почему специализированные LLM реже галлюцинируют Обычные LLM чатботы подходят для разговора по душам или поиска случайных фактов в интернете, толкования снов и тому подобных вещей. Это просто смешная игрушка. Для серьёзных задач (бизнес, финансы, медицина, принятие решений) это неприемлемо. Для бизнеса галлюцинации LLM — это не «забавные ошибки», а риск: неверная цифра в отчёте, выдуманное условие договора, перепутанная дата в регламенте могут привести к самым непредсказуемым ...

👁 1.4K📷 photo
Bbigdata_1
bigdata_1
1 дек., 15:52

Вы не сможете это развидеть: краткий гайд по определению LLM-текстов Но сейчас я вижу то, что я не просто не люблю, я ненавижу — нейрослоп. Это статьи, которые полны логических ошибок, не отвечает на вопрос заданный в заголовке, с кучей воды. Это не просто дно копирайтинга, это "снизу постучали". Это не было бы проблемой, будь это плохие авторы. Плохие авторы конечны. LLM может генерировать гигабайты текста, только плати за токены, и весьма недорого — у меня есть несколько проектов, в которых LL...

👁 1.3K📷 photo
Bbigdata_1
bigdata_1
13 дек., 08:29

OMC25: Новый стандарт данных для моделирования молекулярных кристаллов Опубликован OMC25 - самый масштабный на сегодняшний день набор данных по молекулярным кристаллам, рассчитанный с использованием теории функционала плотности (DFT) в VASP. Происхождение данных Датасет базируется на траекториях релаксации кристаллов. Генерация исходных структур производилась инструментом Genarris 3.0 на основе молекул из проверенного набора OE62. Это гарантирует надежность химических структур при беспрецедентно...

👁 1.3K📷 photo
Bbigdata_1
bigdata_1
24 нояб., 06:16

LLM Council Идея этого репозитория в том, что вместо того, чтобы задавать вопрос вашему любимому поставщику LLM (например, OpenAI GPT 5.1, Google Gemini 3.0 Pro, Anthropic Claude Sonnet 4.5, xAI Grok 4 и т.д.), вы можете объединить их в свой «Совет LLM». Этот репозиторий — это простое локальное веб-приложение, которое выглядит как ChatGPT, но использует OpenRouter, чтобы отправлять ваш запрос сразу нескольким LLM, затем просит их оценить и ранжировать ответы друг друга, а в конце Председатель Со...

👁 1.3K📷 photo
Bbigdata_1
bigdata_1
13 нояб., 20:37

🏆 Топ 6 типов моделей ИИ 1. Machine Learning Models (Модели машинного обучения) - Описание: учатся на размеченных или неразмеченных данных для выявления закономерностей, классификации или прогнозирования результатов. Включают подходы с учителем, без учителя и с частичным обучением. - Примеры: деревья решений, Random Forest, SVM, XGBoost (с учителем); K-Means, DBSCAN, PCA (без учителя); Label Propagation, Semi-Supervised SVM (с частичным обучением). - Рабочий процесс: сбор размеченных данных → о...

👁 1.2K📷 photo
Bbigdata_1
bigdata_1
29 янв., 12:27

Команды Яндекса ищут продуктовых и data-аналитиков, а также data scientists с опытом на Python от 3 лет. Участвуйте в Weekend Offer, чтобы всего за 2 дня пройти все собеседования и получить офер. Как участвовать? ⚪ Зарегистрироваться на сайте до 25 февраля. ⚪ Пройти две технические секции 28 февраля. ⚪ Познакомиться с командами и получить офер 1 марта. Мы опираемся на научные исследования и аналитические данные, а потом превращаем их в реальные продукты для миллионов пользователей. Присоединяйте...

👁 1.0K🎬 video
Bbigdata_1
bigdata_1
20 янв., 14:38

Традиционный ИИ vs Агентный ИИ vs Агентный RAG В разговорах о развитии технологий часто смешивают понятия Традиционного ИИ, Агентного ИИ и Агентного RAG, хотя на самом деле это совершенно разные ступени эволюции. Давайте разберем их отличия простым языком. Традиционный ИИ представляет собой статичный пайплайн - классическую схему машинного обучения, с которой многие начинали. Это линейный и односторонний процесс: мы определяем задачу, собираем данные, обучаем модель, развертываем её, а затем пол...

👁 1.0K🎬 video
Bbigdata_1
bigdata_1
14 янв., 08:43

🧠 Бесконечный контекст без дообучения? Встречайте DroPE от Sakana AI Обычно, чтобы заставить LLM работать с длинным контекстом (Long Context), приходится либо использовать методы интерполяции (как YaRN), либо проводить дорогостоящий файн-тюнинг на длинных последовательностях. Ребята из Sakana AI (те самые, что делают Evolution Merging) выпустили новый метод — DroPE (Dropping Positional Embeddings). В чем суть? Авторы заметили парадокс: позиционные эмбеддинги (например, RoPE) критически важны дл...

👁 1.0K🎬 video
Bbigdata_1
bigdata_1
13 нояб., 09:00

XLTable - OLAP Cервер для нового стека данных Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel. Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента. 📈Ключевые возможности XLTable: • Аналог MS OLAP (SSAS) для больших данных • Интеграция с MS Excel по протоколу XMLA • Поддержка ClickHouse, BigQuery, Snowflake • Скоро: YDB, Greenplum • Множество групп мер, иерархий и измерений в одном кубе • Гибкие настройки кэширования • Ра...

👁 970📷 photo
Bbigdata_1
bigdata_1
29 янв., 11:26

HunyuanImage 3.0-Instruct теперь полностью в open-source 🔥 Модель стремительно поднялась в Tier-1 глобального рейтинга Arena Image Edit и уже воспринимается как одна из самых мощных open-source Image-to-Image моделей. По сути - новый ориентир (SOTA) для всего сообщества. Что это даёт на практике: - Редактирование изображений по текстовым инструкциям на топовом уровне - Максимально точное следование промптам в духе «измени, но сохрани структуру» - Уверенный баланс качества, детализации и управля...

👁 933📷 photo

Типы хуков

Нейтральный13 | 815 просм.
Статистика4 | 1.1K просм.
Вопрос1 | 1.0K просм.

Длина постов

Очень длинные (1000+)13 | 914 просм.
Длинные (500-1000)3 | 1.1K просм.
Короткие (<200)1 | 358 просм.

Влияние эмодзи

749
С эмодзи (9)
1.0K
Без эмодзи (9)
-26.6% охвата

Типы контента

🎬
3
video
1.0K просм.
📷
13
photo
921 просм.
📝
2
text
443 просм.
BigData (@bigdata_1) — Telegram-канал | PostSniper