MML || DL

ML || DL

@QuantumPhys📚 Образование🇷🇺 Русский📅 март 2026 г.

Код, нотатки, цікаві статті на тему машинного та глибокого навчання. --- З приводу питань звертатися до: @MagnumGrizzly

📊 Полная статистика📝 Все посты
##39#092
1.1K
Подписчики
656,882
Ср. охват
62.4%
Вовлечённость
17
Постов
~0.1
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

17 из 17
QQuantumPhys
QuantumPhys
16 сент., 14:04

Attention Sinks: Allowing Attention Not To Pay Attention 🙅‍♂️ Нещодавно читав гарний пост про архітектуру GPT-OSS. Більшість змін порівняно з GPT2 були вже знайомі з таких відкритих архітектур як LLaMa, Qwen, або Gemma, але є одна цікава ідея, про яку раніше не чув — attention sinks. Recap: Attention Patterns ✍️ Пригадаємо, що у механізмі уваги для кожного токену формується так званий attention pattern — ваги, з якими він “зверне увагу” на попередні токени з контексту (включно з ним самим). Для...

👁 1.2K
QQuantumPhys
QuantumPhys
22 окт., 13:23

Розбираємо цікаву статтю LLMs Can Get Brain Rot 😌 Стаття про те, що моделі теж деградують від думскролінгу. Дослідники з Техасу опублікували дуже цікаву роботу, яка викликала хвилю обговорень. Вони показали, що якщо LLM почати донавчати на низькоякісних даних із соцмереж коротких, популярних, клікабельних постах, то вона починає втрачати свої когнітивні здібності. Приблизно так само, як людина втрачає увагу і пам'ять, коли занадто багато думсерфіть. Чому так: Фактично, експеримент був наступним...

👁 890
QQuantumPhys
QuantumPhys
16 окт., 09:22

Anthropic тихо випустили Claude Haiku 4.5 Anthropic тихо і без зайового шуму презентували міні-версію Claude нового покоління. Модель одразу додали в Claude Code, Claude для Chrome, в чаті та API. На SWE-bench модель набирає 73,3%. Це більше, ніж у Claude Sonnet 4 (72,7%). Адже цю модель випустили всього півроку тому, і вона довго вважалася SOTA для кодування. Тепер таку ж якість можна отримати втричі дешевше і вдвічі швидше. Модель перевершує Sonnet 4 в метриках на Computer Use. Загалом, це пов...

👁 809📷 photo
QQuantumPhys
QuantumPhys
18 нояб., 15:45

Ось і під'їхала технічна карта Gemini 3.0 з бенчмарками😋 Чекаємо на офіційний реліз, має бути цікаво, а зараз деякі метрики з тех.карти: – На багатьох бенчмарках істотно обходить GPT-5.1 і Sonnet 4.5. Особливо виділяється Humanity's Last Exam і ARC-AGI 2. – Круті результати на бенчмарках, пов'язаних з усілякими агентськими здібностями, розумінням зображень, відео та інтерфейсів. Це багатообіцяюче. – У кодуванні як Sonnet 4.5, щодо Gemini 2.5 Pro приріст гарний, але в цілому рівень Sonnet 4.5.

👁 694📷 photo
QQuantumPhys
QuantumPhys
24 нояб., 08:43

Андрій Карпаті випустив цікавий влог по створенню LLM Council😍 LLM Council — це проста локальна веб-програма з інтерфейсом, як у ChatGPT, але з тією різницею, що запит надсилається через Openrouter декільком LLM. Отримані відповіді перехресно оцінюються і ранжуються, і, нарешті, «модель-голова ради» формує остаточну відповідь. Для використання потрібен API-ключ OpenRouter. На ваші запити відповідає рада з мовних моделей. Ідея полягає в тому, що замість того, щоб задавати питання одній LLM, ви м...

👁 669
QQuantumPhys
QuantumPhys
7 окт., 17:23

Відійдемо трохи від новин стосовно OpenAI Devday та розглянемо нобелівку з фізики 😜 Цього року присудили за відкриття в галузі квантових обчислень. Нагороду щойно отримали Джон Кларк, Мішель Деворет і Джон Мартініс. У 80-х вони вперше довели, що явища квантової механіки, які зазвичай спостерігаються тільки на мікроскопічному рівні, можуть проявлятися в повнорозмірних системах. Вони встановили, що так зване квантово-механічне тунелювання можливе на макрорівні. У їхніх експериментах використовува...

👁 634📷 photo
QQuantumPhys
QuantumPhys
29 сент., 21:12

Прилетіло оновлення для Claude Sonnet 4.5 та Claude Code😌 Claude Sonnet 4.5🫶 Тепер у Anthropic знову SOTA модель для кодування. Модель впевнено обганяє GPT-5 на всіх бенчмарках з програмування, на інших йдуть майже нарівні. Claude Code✌️ – Додали нове розширення для VS Code – Оновили інтерфейс терміналу – Додали команду для швидкого повернення до попереднього чекпоїнту, або на кілька кроків назад і команду для швидкого переходу до розширеного ризонінгу – Тепер агент прямо в терміналі зможе ств...

👁 629📷 photo
QQuantumPhys
QuantumPhys
27 сент., 10:12

Кохана, прокидайся, у нас перша українська мультимодальна LLM ☕️ Вийшла MamayLM v1.0 — модель на базі Gemma 3, натренована на датасеті Kobza (писав про нього туточки). Gemma обрали, бо базова модель і так добре знає українську, тож якщо трохи допилити, то взагалі буде бомба 💣 Модель краще за будь-яку іншу знає нашу історію та культуру, а також файно вирішує українське ЗНО — на бенчмарку, який нещодавно вірусився, MamayLM упевнено обходить майже всі опенсорсні моделі, навіть з більшою кількістю ...

👁 590📷 photo

Типы хуков

Нейтральный15 | 673 просм.
Статистика2 | 536 просм.

Длина постов

Очень длинные (1000+)9 | 678 просм.
Длинные (500-1000)4 | 692 просм.
Короткие (<200)3 | 537 просм.

Влияние эмодзи

656
С эмодзи (12)
658
Без эмодзи (5)
-0.3% охвата

Типы контента

📝
8
text
689 просм.
📷
8
photo
647 просм.
🎬
1
video
473 просм.
ML || DL (@QuantumPhys) — Telegram-канал | PostSniper