M
Mark's blog
@difhel_b319 подп.
721просмотров
29 сентября 2025 г.
📷 ФотоScore: 793
Markdown-first Вчера в Twitter лучшего JS рантайма ever я увидел пост: ребята подумали, что их доки часто читают нейросети, и решили отдавать им статьи в формате Markdown (вместо обычного HTML с client side рендерингом, как для реальных пользователей). Результат: token usage при чтении моделью документации упал в 10 раз 🔥. Это означает, что документация будет занимать в 10 раз меньше контекста, что значительно улучшает опыт вайбкодеров разработчиков. Делается это просто: по заголовку Accept определяется, что значение text/plain или text/markdown есть и имеет больший приоритет, чем text/html (его отправляют обычные браузеры). Уже даже советуют перегонять готовую HTML статику в Markdown через разные утилиты, вроде npx @wcj/html-to-markdown-cli. Но я считаю, это в корне неправильный подход: если сайт (блог, документация, что угодно) изначально не был ориентирован под разметку Markdown, то автоматизированные тулы будут терять форматирование и результат на выходе будет неточным. Я уже не говорю, что это будет работать только для static сайтов/SSR. Более правильный подход? Markdown-first. Взять, к примеру, мой блог (🐈 difhel.dev/blog, 🧑‍💻 difhel/blog): все статьи в нем написаны в формате MDX, который объединяет Markdown для разметки и React JSX для сложных элементов (например, для карусели картинок). Это позволяет удобно встраивать компоненты любой сложности в статьи, в то время как сохраняет нейросетям возможность потреблять контент эффективно. Планирую в свободное время тоже сделать отдачу MDX-исходников статей нейросетям для блога. Вероятно, придется поколдовать с Docusaurus/Vercel. Кстати, вспомнил еще одну гениальную идею для уменьшения token usage: отдавать данные на китайском. По идее, это должно уменьшить в ~2 раза, но непонятно, как повлияет на поведение модели (например, если ей задали вопрос на английском, а после прочтения моего блога она заговорила на китайском — будет не круто), надо экспериментировать.
721
просмотров
1950
символов
Да
эмодзи
Да
медиа

Другие посты @difhel_b

Все посты канала →
Markdown-first Вчера в Twitter лучшего JS рантайма ever я ув — @difhel_b | PostSniper