Всегда было интересно найти промпты, которые обходят отказы ллмок и заставляют их ответить на запрещенные вопросы. Наткнулся на такой репозиторий. Кое-где работают 🙃 Из интересного у этого же автора - подборка ликнутых системных промптов от разных провайдеров
Записки MLEшника
Yet another machine learning engineer Автор @egshes, Yandex (ex. T-Bank, Celsus)
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Спустя долгое время отсутствия приношу пост 👀 Наверняка вы когда-нибудь сталкивались с тем, что питонячий код/скрипт зависал во время выполнения. В такие моменты очень хочется знать, собственно, в каком месте это происходит... Так вот это довольно легко сделать (по крайней мере на Linux) с помощью дебагера gdb Делается так: 0. Сохраняем локально файл libpython.py. Это нужно, чтобы в gdb стек и код вокруг отображался "по-питонячему" (иначе это будет малопонятный C++). - Для этого открываем CPyth...
Нашел кайфовый генератор листов бумаги через блендер Пригодится, например, для ситетических OCR данных. Вроде может сохранить bbox-ы Чтобы было проще его понять, вот что я выяснил: 1. В примере текст - psd файл. Это не обязательно, работает и с png 2. Основные настройки: - config.camera.relative_camera_distance - приближает/отдаляет листок - config.camera.orbit=(a, b) - меняет позицию камеры относительно листка - a - угол наклона к нормали (а = 30, значит угол наклона камеры - 70 градусов к стол...
у вас такое бывало, когда в очередной раз столкнувшись с чем-то неработающим в сети, ты обещаешь себе изучить их? Узнали? так вот после секции вайбдебагинга я честно покопал DNS: 1. Посмотрел легендарного курс по сетям Андрея Созыкина. Он теперь свежий - три месяца назад снят. 18-24 видео 2. Поболтал с Клодом 3. Проделал практику из видео (вот это прям мастхев. Итеративный режим звучит просто, а сам я его не с первого раза руками сделал) Теперь хоть понимаю выход команды dig 😅 А лекции по сетям...
Извините! Я почему вредный был? Потому что у меня cloudpathlib не было! А теперь я сразу добреть начну. И какую-нибудь папку на s3 заведу. Чтоб жить веселее. Ты домой приходишь, и удобно файлы на s3 кладешь… Э-эх! Вечно спотыкался об интерфейс boto3. Как-то там не по-питоновски всё. А я pathlib.Path люблю. Вот и попробовал cloudpathlib, который дает интерфейс Path для s3 (а также gs и azure). Понравилось. Теперь и Вам советую Еще он хорошо комбинируется с тредингом, если надо много файликов загр...
TLDR доклада "Как в яндексе делают ранжирование нейросетками в RecSys?" 1. Категориальные фичи кодируют эмбедингами 2. Вещественные фичи нормализуют / делают улучшенную бинаризацию (называют кусочно-линейным кодированием) 3. Используют один слой DCN, чтобы моделировать комбинации признаков 4. Затем 5 MLP слоев и дропаут 5. Добавляют на вход фичи с других моделей по пользователю (например, у них есть трансформер, который делает вектор пользователя по его истории) 6. Делаю несколько голов на неско...
Ни для кого не секрет, что лекции Карпатого - это концентрат знаний Сегодня на обзоре Deep Dive into LLMs like ChatGPT (обзор на лекцию, реально?!) О чем? Из каких строительных блоков состоит LLM, и как ее учат, чтобы получит чат-асистента Что показалось мне интересным: 1. Андрей разбирает, почему есть "глупые ошибки" - "Сколько r в strawberry?" - потому что токенизация по токенам, а не по буквам - "Что больше 9.11 или 9.9?" - что модель путают библейские тексты, в которых 9.11 идет позже 9.9 - ...
Полезная статейка о использовании блендера для синтетики вдогонку к посту о генерилке синтетических листков Если в первом случае все управлялось конфигами, то тут уже напрямую питоном Вообще там много интересных статей в блоге DeepSchool (не реклама 🙂)
Хороший такой, легкий видосик по устройству питона. Судя по описанию - это TLDR книги Мэтта Харрисона "Как устроен Python". Тут по верхам - объекты, хранение их в памяти и ссылки на них, изменяемые и неизменыемые типы, работа с файлами, пространства имен. Будет полезен, если не читали ничего про питон или хотите освежить базу
Сейчас много шума вокруг MCP (Model Context Protocol). Разберемся, что и зачем Если коротко, то это крепкий подход к унификации взаимодействия LLM с внешними инструментами Почему это хорошо: - Теперь можно не писать велосипеды, подключая, скажем, postgres или поиск в гугл, а взять готовую реализацию (например, тут) - Станет легче дружить между собой клиентов и сервера. Уже сейчас взрыв имплементации серверов и клиентов - Наверняка, это доедет в обучение моделей, и они уже из коробки будут знать,...