Data Science News

@data_science_news💻 Технологии🇷🇺 Русский📅 март 2026 г.

Данные, инструменты для них и немного математики. Чат: @data_science_chat Для контактов: @telejamm

📊 Полная статистика 📝 Все посты

##39

441

Подписчики

937,25

Ср. охват

212.5%

Вовлечённость

Постов

—

В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

20 из 20

data_science_news

2 янв., 12:37

А у нас тут на русском языке есть доклады по машинному обучению прямо на границе текущего развития науки. Названия к видео говорящие, ориентироваться просто. Могу со своей стороны выделить несколько выступлений со школы 2023 года: Доклад про комбинацию ML и физических методов с примерами из реальных земных задач. Хороший обзорный рассказ и для общего развития полезно. Если вы хотите знать почему в adam или adagrad так как есть, откуда это всё эти оптимизации взялись, можно ли сделать лучше, и ка...

👁 2.3K

📊 Аналитика

data_science_news

21 мая, 14:39

Harald Steck, математик из Netflix, опубликовал работу с говорящим названием Is Cosine-Similarity of Embeddings Really About Similarity? Автор задаётся вопросом почему косинус расстояние работает хуже в некоторых практических сценариях чем скалярное произведение для ненормированных векторов? Для ответа на этот вопрос в работе представлена линейная декомпозиция на синтетических данных, аналогично факторизации матриц в задачах рекомендаций. В выводах отмечено, что косинус расстояние сильно зависит...

👁 1.6K

📊 Аналитика

data_science_news

22 сент., 12:23

Всем привет! Сентябрь уже заканчивается, самое время разобрать задачку. Классическая игла Бюффона на youtube и vk.

👁 1.4K

📊 Аналитика

data_science_news

7 окт., 13:46

Смотрим на t-тест повнимательнее (youtube, vk)

👁 1.4K

📊 Аналитика

data_science_news

23 февр., 10:51

Если вам наскучили трудовые будни, посмотрите новое ML инженерное видео от Андрея Картпаты. С этим материалом вы: - разберётесь, наконец, вспомните особенности UTF-8 - напишите прямую реализацию токенайзера - посмотрите открытые библиотеки токенизации - поймете магические регулярки для препроцессинга текста в GPT-2-4 - осознаете важность токенизации (!) - увидите как можно заставить ChatGPT выдавать неправильно на граничных случаях токенизации. Внимание! В процессе просмотра возникает непреодоли...

👁 1.3K

📊 Аналитика

data_science_news

5 мая, 11:57

А вот и первая лекция: https://youtu.be/qPJ5Dz3bKTQ

👁 1.3K

📊 Аналитика

data_science_news

10 нояб., 15:41

Хорошая обзорная работа по функциям активации (декабрь 2022). Есть почти все, не нужно бегать по разным частям интернета если вдруг забыли как, например, выглядит первая производная gelu. Всё с тестами, как положено https://arxiv.org/abs/2209.02681

👁 1.0K

📊 Аналитика

data_science_news

16 янв., 11:54

В RL есть устоявшаяся терминология подходов к моделям. Если хотите быстро разобраться что к чему, то эта серия видео будет кстати. Несмотря на то что последние лекции несколько укорочены, общее представление можно получить достаточно быстро. И отдельно можно посмотреть примерно то же самое, но со спецификой offline RL.

👁 1.0K

📊 Аналитика

data_science_news

6 нояб., 11:48

Супер инженерный доклад от Netflix про то как они строят распределённую MLOps систему для обучения рекомендательных моделей. То что FSx, S3, tf.data это уже не новость. А вот использование Ray в этом процессе это новинка. В докладе много инженерных деталей, и, в принципе, весь процесс обработки и подачи данных сверху виден. https://www.anyscale.com/blog/heterogeneous-training-cluster-with-ray-at-netflix

👁 973

📊 Аналитика

data_science_news

9 сент., 12:36

Если вы начинаете интересоваться такой сферой как Quant, стоит обратить внимание на блог-пост с обзором фундаментальных научных статей из этой области

👁 786

📊 Аналитика

Типы хуков

Нейтральный15 | 958 просм.

Вопрос3 | 954 просм.

Статистика2 | 754 просм.

Длина постов

Длинные (500-1000)5 | 1.4K просм.

Короткие (<200)5 | 1.1K просм.

Очень длинные (1000+)5 | 478 просм.

Средние (200-500)5 | 799 просм.

Влияние эмодзи

220

С эмодзи (1)

975

Без эмодзи (19)

-77.4% охвата

Типы контента

📝

text

937 просм.

⚠️ 0/100

Подозрительно высокий охват

#8680

из 13,328 в Технологии