Год подходит к концу, поэтому самое время подводить итоги. В этом посте разбираю одну из центральных тем блога в этом году: собеседования на ML/Research роли. ⚫️В первой половине года я много собеседовал и понял, что хочется делиться тем, что может помочь соискателям. Так появились эти тексты. Они разные по формату и теме, все субъективные и основаны на личном опыте. А теплые сообщения в личку о пользе текстов только мотивируют стараться ✨ Типы вопросов на собеседованиях про Трансформеры Подборк...
max.sh
Карьера, образование и исследования в мире AI через призму собственного опыта. Канал ведет Макс Шапошников, ex Applied Scientist в FAANG. Профессионально ловлю CUDA OOM. Cвязь в тг - @PorcelainFox Linkedin - https://www.linkedin.com/in/maxshapp
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
15 из 15Когда-то давно, во времена учебы в ШАДе, нам читали интенсив по основам архитектуры GPU и разработки на CUDA. Обещали рассказать, как устроены видеокарты и почему они эффективны для машинного обучения. Я тогда дальше model.to('cuda:0') в этом вопросе ничего не знал, поэтому с интересом записался. Лекции читали разработчики из Nvidia. Да, это было такое время, когда у компании был Московский офис и они периодически нанимали DL-инженеров, а иногда и стажеров (марафон технических раундов и глубоких...
На ютубе разлетелось видео, в котором стример разбирает якобы слитый собес в Антропик, секция кодинг, на позицию Senior AI engineering, Inference team. Смотреть тут Пост на блайнде Слить такое в сеть мог только сам кандидат. Учитывая, что интервью он прошел, объективно, плохо (для человека с позиционированием себя как 10+ лет опыта разработки на c++ очень плохо), зачем такое выкладывать не очень понятно. Только для пиара. Но его оригинал я не нашел, кстати. Так что воспринимать контент стоит в л...
Бодро влетаем в новый год. Сегодня про Claude Code Skills. Пару месяцев назад Антропики добавили концепцию Agent Skills Skills, если по-простому, это папки с SKILLS.md и любыми вспомогательными файлами/скриптами, которые агент может по необходимости подтягивать в контекст и использовать как «встроенный опыт». Преимуществ несколько: 1) переиспользуемый контекст. Вы, как пользователь Claude Code, можете создать свои кастомные скиллы и переиспользовать в проекте / внутри организации 2) более эффект...
Недавно вернулся со второго командного оффсайта (про прошлый писал в Июле). В западной культуре, как в больших компаниях так и стартапах, в целом принято выделять первую половину января под разного рода планирования в формате собраться всем в одной месте. Так можно провести большие ретро, послушать речи фаундера (или директора), понять, почему слишком медленно бежим и все в таком духе. По итогу, устаешь гораздо больше, чем от обычной рабочей недели. В силу своего размера, старатапы (которым не н...
А в финальном посте года немного рефлексии по итогам полугода работы в стартапе. О скорости перемен Полгода назад ушел из биг теха ловить счастье делать pre-PMF стартап (про первый месяц писал тут). Компания без продукта, но с большим раундом (фаундер уже продал юникорна) в эпоху AI трансформаций == постоянный пивот в новое направление. Начинали с фреймворка про Spec Driven Development, а сейчас делаем платформу, на которой можно измерять перформанс coding-агентов с разных сторон: насколько хоро...
Sutskever's List. Согласно лору интернета, это список статей, которым Илья поделился в частной беседе с John Carmack (известный разработчик, создатель Doom, впоследствии работал над Oculus), добавив: ‘If you really learn all of these, you’ll know 90% of what matters today.’ Твит набрал большую популярность (ссылка) и довольно активно разлетелся впоследствии и по другим платформам, в частности реддиту. Однако никаких подтверждений подлинности этого самого списка от Ильи на эту тему не было, как и...
Как строить evaluation системы для AI агентов? Очередной крутой блог пост от Антропиков. Читать тут. Прорывных мыслей, бенчмарков или сокрального знания тут не найти, но зато очень хорошая структура (такое пригождается на систем дизайн интервью, если что), отличный технический словарь (task, transcript, evaluation harness, agent harness, и.т.д) и призыв к действию для тех, кто активно шаманит над агентами в рабочих задачах. И действительно. Если в прошлом году все поголовно были увлечены внедрен...
💼 Hiring Post Стартап растет и ищет к себе людей на роль Member of Technical Staff - AI Engineer Полное описание вакансии можете посмотреть тут. • Идеальный Кандидат. Это человек с большим бэкграундом в Software Engineering и умением плотно работать с рисерчерами (моей командой). Так, чтобы рисерч прототипы быстро и надежно доходили до продукта и можно было легко итерироваться, скейлить компьют. • Немного про компанию. Сейчас фокус на том, чтобы делать Eval-ы разных кодинг агентов, подсвечивать...
Сегодня ребята из Nebius релизнули новую версию SWE-rebench-v2. Большой бенчмарк для оценки способности агентов решать задачи в реальных кодовых базах для разных языков программирования. Видно, что ребята проделали колоссальную работу, чтобы собрать такой датасет. Поддержите лайком на HF Papers, чтобы больше людей знали про хорошую статью! И отдельно порекомендую канал Ибрагима, автора статьи. Все про кодинговых агентов, крутые технические заметки, карьера в рисерче и наблюдения из жизни!