ML || DL

@QuantumPhys📚 Образование🇷🇺 Русский📅 март 2026 г.

Код, нотатки, цікаві статті на тему машинного та глибокого навчання. --- З приводу питань звертатися до: @MagnumGrizzly

📊 Полная статистика 📝 Все посты

##39#092

1.1K

Подписчики

656,882

Ср. охват

62.4%

Вовлечённость

Постов

~0.1

В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

17 из 17

QuantumPhys

16 сент., 14:04

Attention Sinks: Allowing Attention Not To Pay Attention 🙅‍♂️ Нещодавно читав гарний пост про архітектуру GPT-OSS. Більшість змін порівняно з GPT2 були вже знайомі з таких відкритих архітектур як LLaMa, Qwen, або Gemma, але є одна цікава ідея, про яку раніше не чув — attention sinks. Recap: Attention Patterns ✍️ Пригадаємо, що у механізмі уваги для кожного токену формується так званий attention pattern — ваги, з якими він “зверне увагу” на попередні токени з контексту (включно з ним самим). Для...

👁 1.2K

📊 Аналитика

QuantumPhys

22 окт., 13:23

Розбираємо цікаву статтю LLMs Can Get Brain Rot 😌 Стаття про те, що моделі теж деградують від думскролінгу. Дослідники з Техасу опублікували дуже цікаву роботу, яка викликала хвилю обговорень. Вони показали, що якщо LLM почати донавчати на низькоякісних даних із соцмереж коротких, популярних, клікабельних постах, то вона починає втрачати свої когнітивні здібності. Приблизно так само, як людина втрачає увагу і пам'ять, коли занадто багато думсерфіть. Чому так: Фактично, експеримент був наступним...

👁 890

📊 Аналитика

QuantumPhys

16 окт., 09:22

Anthropic тихо випустили Claude Haiku 4.5 Anthropic тихо і без зайового шуму презентували міні-версію Claude нового покоління. Модель одразу додали в Claude Code, Claude для Chrome, в чаті та API. На SWE-bench модель набирає 73,3%. Це більше, ніж у Claude Sonnet 4 (72,7%). Адже цю модель випустили всього півроку тому, і вона довго вважалася SOTA для кодування. Тепер таку ж якість можна отримати втричі дешевше і вдвічі швидше. Модель перевершує Sonnet 4 в метриках на Computer Use. Загалом, це пов...

👁 809📷 photo

📊 Аналитика

QuantumPhys

18 нояб., 18:03

Вийшла)

👁 762📷 photo

📊 Аналитика

QuantumPhys

18 нояб., 15:45

Ось і під'їхала технічна карта Gemini 3.0 з бенчмарками😋 Чекаємо на офіційний реліз, має бути цікаво, а зараз деякі метрики з тех.карти: – На багатьох бенчмарках істотно обходить GPT-5.1 і Sonnet 4.5. Особливо виділяється Humanity's Last Exam і ARC-AGI 2. – Круті результати на бенчмарках, пов'язаних з усілякими агентськими здібностями, розумінням зображень, відео та інтерфейсів. Це багатообіцяюче. – У кодуванні як Sonnet 4.5, щодо Gemini 2.5 Pro приріст гарний, але в цілому рівень Sonnet 4.5.

👁 694📷 photo

📊 Аналитика

QuantumPhys

10 окт., 21:22

👁 684📷 photo

📊 Аналитика

QuantumPhys

24 нояб., 08:43

Андрій Карпаті випустив цікавий влог по створенню LLM Council😍 LLM Council — це проста локальна веб-програма з інтерфейсом, як у ChatGPT, але з тією різницею, що запит надсилається через Openrouter декільком LLM. Отримані відповіді перехресно оцінюються і ранжуються, і, нарешті, «модель-голова ради» формує остаточну відповідь. Для використання потрібен API-ключ OpenRouter. На ваші запити відповідає рада з мовних моделей. Ідея полягає в тому, що замість того, щоб задавати питання одній LLM, ви м...

👁 669

📊 Аналитика

QuantumPhys

7 окт., 17:23

Відійдемо трохи від новин стосовно OpenAI Devday та розглянемо нобелівку з фізики 😜 Цього року присудили за відкриття в галузі квантових обчислень. Нагороду щойно отримали Джон Кларк, Мішель Деворет і Джон Мартініс. У 80-х вони вперше довели, що явища квантової механіки, які зазвичай спостерігаються тільки на мікроскопічному рівні, можуть проявлятися в повнорозмірних системах. Вони встановили, що так зване квантово-механічне тунелювання можливе на макрорівні. У їхніх експериментах використовува...

👁 634📷 photo

📊 Аналитика

QuantumPhys

29 сент., 21:12

Прилетіло оновлення для Claude Sonnet 4.5 та Claude Code😌 Claude Sonnet 4.5🫶 Тепер у Anthropic знову SOTA модель для кодування. Модель впевнено обганяє GPT-5 на всіх бенчмарках з програмування, на інших йдуть майже нарівні. Claude Code✌️ – Додали нове розширення для VS Code – Оновили інтерфейс терміналу – Додали команду для швидкого повернення до попереднього чекпоїнту, або на кілька кроків назад і команду для швидкого переходу до розширеного ризонінгу – Тепер агент прямо в терміналі зможе ств...

👁 629📷 photo

📊 Аналитика

QuantumPhys

27 сент., 10:12

Кохана, прокидайся, у нас перша українська мультимодальна LLM ☕️ Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на датасеті Kobza (писав про нього туточки). Gemma обрали, бо базова модель і так добре знає українську, тож якщо трохи допилити, то взагалі буде бомба 💣 Модель краще за будь-яку іншу знає нашу історію та культуру, а також файно вирішує українське ЗНО — на бенчмарку, який нещодавно вірусився, MamayLM упевнено обходить майже всі опенсорсні моделі, навіть з більшою кількістю ...

👁 590📷 photo

📊 Аналитика

Типы хуков

Нейтральный15 | 673 просм.

Статистика2 | 536 просм.

Длина постов

Очень длинные (1000+)9 | 678 просм.

Длинные (500-1000)4 | 692 просм.

Короткие (<200)3 | 537 просм.

Влияние эмодзи

656

С эмодзи (12)

658

Без эмодзи (5)

-0.3% охвата

Типы контента

📝

text

689 просм.

📷

photo

647 просм.

🎬

video

473 просм.

✅ 95/100

Активность естественная

#7781

из 21,969 в Образование