DData Mining | Анализ данных🚀

Data Mining | Анализ данных🚀

@dataminingteam💻 Технологии🇬🇧 English📅 март 2026 г.

• Купить рекламу: t.me/sahib_space Админ: sahib_space • Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid= • Группа в ВК: vk.com/datamining.team

📊 Полная статистика📝 Все посты
##036
3.6K
Подписчики
1.0K
Ср. охват
29.2%
Вовлечённость
19
Постов
~0.1
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

19 из 19
Ddataminingteam
dataminingteam
30 апр., 19:46

II-Thought-RL-v0 — датасет для RL с 340 тысячами задач, решающий проблемы старых наборов данных, такие как дублирование и низкое качество. Он включает верификацию и фильтрацию для повышения точности, но имеет дисбаланс, с преобладанием математики и программирования. https://www.ii.inc/web/blog/post/ii-thought

👁 2.5K📷 photo
Ddataminingteam
dataminingteam
29 апр., 19:41

Google DeepMind исследует, как LLM учат факты, обнаружив, что процесс происходит в три этапа: от запоминания статистических закономерностей до формирования связей между элементами текста и, наконец, к точному воспроизведению фактов. Это исследование помогает понять причины “катастрофического забывания” при добавлении новых данных. https://arxiv.org/pdf/2503.21676

👁 2.0K📷 photo
Ddataminingteam
dataminingteam
28 апр., 19:33

Статья объясняет, как использовать данные из «Яндекс.Метрики» для глубокого анализа и интеграции с другими источниками, такими как CRM-системы, для получения инсайтов и проверки гипотез. В ней также приводится инструкция по получению OAuth-токена и примеры Python-кода для работы с API Яндекс.Метрики. https://habr.com/ru/companies/digitalleague/articles/742156/

👁 1.6K📷 photo
Ddataminingteam
dataminingteam
27 апр., 19:51

В данной работе предлагается новая методика MetaLoRA, которая сочетает принципы мета-обучения и низкоранговой адаптации для эффективного подстраивания нейронных сетей под новые задачи. MetaLoRA улучшает существующие методы, позволяя динамически настраивать параметры и лучше учитывать особенности различных задач, сохраняя при этом вычислительную эффективность. https://arxiv.org/pdf/2504.00460

👁 1.2K📷 photo
Ddataminingteam
dataminingteam
26 апр., 19:41

GraphMaster — первая многоагентная система для синтеза графовых данных в условиях ограниченных данных. Она использует четыре специализированных агента LLM для оптимизации процесса синтеза, обеспечивая семантическую согласованность и структурную целостность, и демонстрирует превосходство по сравнению с традиционными методами синтеза. https://arxiv.org/pdf/2504.00711

👁 1.1K📷 photo
Ddataminingteam
dataminingteam
26 февр., 21:35

На днях Google выкатил статью с дико неочевидным тезисом: чтобы модель отвечала точнее, нужно дважды отправить ей один и тот же промпт. Звучит как шутка, но работает на всех топ-моделях (Gemini, GPT, Claude, Deepseek) и почти в 70% тестов. Cуть в том, что дублирование заставляет думать нейронку в заданном контексте. Что особенно цепляет: мы привыкли, что сложное чинят сложным, а тут - просто Ctrl+C, Ctrl+V, и точность повышается. Самый яркий пример - тест NameIndex, где модель должна назвать 25-...

👁 977📷 photo
Ddataminingteam
dataminingteam
25 апр., 19:31

CFIRE — алгоритм для создания глобальных правил решений из локальных объяснений с использованием майнинга частых элементов. Он решает проблему несогласованности методов объяснения и показывает высокую точность и производительность на 700 моделях черного ящика и 14 наборах данных. https://arxiv.org/pdf/2504.00930

👁 965📷 photo
Ddataminingteam
dataminingteam
26 февр., 22:02

Друзья, добрый вечер! Мы возобновляем публикации на канале. Постараемся радовать вас интересными статьями, материалами. Мы также включили сообщения на канале. Теперь вы можете нам писать. Можете делиться с нами интересными находками, мы их, возможно, опубликуем, чтобы больше людей смогли получить пользу.

👁 806📷 photo

Типы хуков

Нейтральный18 | 955 просм.
Статистика1 | 2.5K просм.

Длина постов

Средние (200-500)7 | 1.5K просм.
Короткие (<200)5 | 751 просм.
Очень длинные (1000+)5 | 504 просм.
Длинные (500-1000)1 | 977 просм.

Влияние эмодзи

977
С эмодзи (1)
1.0K
Без эмодзи (18)
-6.2% охвата

Типы контента

🎬
1
video
2.1K просм.
📷
14
photo
1.1K просм.
📝
4
text
476 просм.
Data Mining | Анализ данных🚀 (@dataminingteam) — Telegram-канал | PostSniper