Отличная статья, которая на примере vLLM разбирает как работ — @neural_info

@neural_info253 подп.

484просмотров

12 ноября 2025 г.

📷 ФотоScore: 532

Отличная статья, которая на примере vLLM разбирает как работает LLM Inference Engine. Не самая легкая для прочтения (где-то 1-2 часа вдумчивого чтения мне понадобилось), но дает хорошее понимание того, какие приемы используются для эффективного сервинга LLM at scale в multi-gpu, multi-node сетапе. https://www.aleksagordic.com/blog/vllm

484

просмотров

339

символов

Нет

эмодзи

Да

медиа

Другие посты @neural_info

Наткнулся тут на видео, рассказывающее идею понижения размера контекста путем использования текстовы👁 455 Современные модели компьютерного зрения видят только то, что у них "перед глазами", не вникая в абст👁 314 Хороший гайд про то как устроены non_blocking и pin_memory операции в PyTorch, наглядно демонстрируе👁 308 OLMo 3 Это, пожалуй, самый честный и воспроизводимый релиз года. Тут выкатили вообще всё: от исходн👁 293 Вы просили — мы сделали 🤝 CLIP + LLM в проде: мультимодальный «Поиск по фото» для маркетплейса Ник👁 284

Все посты канала →

Аналитика канала База постов