DData Science News

Data Science News

@data_science_news💻 Технологии🇷🇺 Русский📅 март 2026 г.

Данные, инструменты для них и немного математики. Чат: @data_science_chat Для контактов: @telejamm

📊 Полная статистика📝 Все посты
##39
441
Подписчики
937,25
Ср. охват
212.5%
Вовлечённость
20
Постов
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

20 из 20
Ddata_science_news
data_science_news
2 янв., 12:37

А у нас тут на русском языке есть доклады по машинному обучению прямо на границе текущего развития науки. Названия к видео говорящие, ориентироваться просто. Могу со своей стороны выделить несколько выступлений со школы 2023 года: Доклад про комбинацию ML и физических методов с примерами из реальных земных задач. Хороший обзорный рассказ и для общего развития полезно. Если вы хотите знать почему в adam или adagrad так как есть, откуда это всё эти оптимизации взялись, можно ли сделать лучше, и ка...

👁 2.3K
Ddata_science_news
data_science_news
21 мая, 14:39

Harald Steck, математик из Netflix, опубликовал работу с говорящим названием Is Cosine-Similarity of Embeddings Really About Similarity? Автор задаётся вопросом почему косинус расстояние работает хуже в некоторых практических сценариях чем скалярное произведение для ненормированных векторов? Для ответа на этот вопрос в работе представлена линейная декомпозиция на синтетических данных, аналогично факторизации матриц в задачах рекомендаций. В выводах отмечено, что косинус расстояние сильно зависит...

👁 1.6K
Ddata_science_news
data_science_news
22 сент., 12:23

Всем привет! Сентябрь уже заканчивается, самое время разобрать задачку. Классическая игла Бюффона на youtube и vk.

👁 1.4K
Ddata_science_news
data_science_news
7 окт., 13:46

Смотрим на t-тест повнимательнее (youtube, vk)

👁 1.4K
Ddata_science_news
data_science_news
23 февр., 10:51

Если вам наскучили трудовые будни, посмотрите новое ML инженерное видео от Андрея Картпаты. С этим материалом вы: - разберётесь, наконец, вспомните особенности UTF-8 - напишите прямую реализацию токенайзера - посмотрите открытые библиотеки токенизации - поймете магические регулярки для препроцессинга текста в GPT-2-4 - осознаете важность токенизации (!) - увидите как можно заставить ChatGPT выдавать неправильно на граничных случаях токенизации. Внимание! В процессе просмотра возникает непреодоли...

👁 1.3K
Ddata_science_news
data_science_news
5 мая, 11:57

А вот и первая лекция: https://youtu.be/qPJ5Dz3bKTQ

👁 1.3K
Ddata_science_news
data_science_news
10 нояб., 15:41

Хорошая обзорная работа по функциям активации (декабрь 2022). Есть почти все, не нужно бегать по разным частям интернета если вдруг забыли как, например, выглядит первая производная gelu. Всё с тестами, как положено https://arxiv.org/abs/2209.02681

👁 1.0K
Ddata_science_news
data_science_news
16 янв., 11:54

В RL есть устоявшаяся терминология подходов к моделям. Если хотите быстро разобраться что к чему, то эта серия видео будет кстати. Несмотря на то что последние лекции несколько укорочены, общее представление можно получить достаточно быстро. И отдельно можно посмотреть примерно то же самое, но со спецификой offline RL.

👁 1.0K
Ddata_science_news
data_science_news
6 нояб., 11:48

Супер инженерный доклад от Netflix про то как они строят распределённую MLOps систему для обучения рекомендательных моделей. То что FSx, S3, tf.data это уже не новость. А вот использование Ray в этом процессе это новинка. В докладе много инженерных деталей, и, в принципе, весь процесс обработки и подачи данных сверху виден. https://www.anyscale.com/blog/heterogeneous-training-cluster-with-ray-at-netflix

👁 973
Ddata_science_news
data_science_news
9 сент., 12:36

Если вы начинаете интересоваться такой сферой как Quant, стоит обратить внимание на блог-пост с обзором фундаментальных научных статей из этой области

👁 786

Типы хуков

Нейтральный15 | 958 просм.
Вопрос3 | 954 просм.
Статистика2 | 754 просм.

Длина постов

Длинные (500-1000)5 | 1.4K просм.
Короткие (<200)5 | 1.1K просм.
Очень длинные (1000+)5 | 478 просм.
Средние (200-500)5 | 799 просм.

Влияние эмодзи

220
С эмодзи (1)
975
Без эмодзи (19)
-77.4% охвата

Типы контента

📝
20
text
937 просм.
Data Science News (@data_science_news) — Telegram-канал | PostSniper