#firstnine #architecture #systemdesign #sre #containerawareness #deploy привет всем! почти месяц писал эту статью (а до этого пол года активно собирал знания для нее). практически все покрыл опытами и, уверен, это будет полезно. в будущем постараюсь переключаться на посты попроще, чтобы в канале была жизнь :) итак, я много до этого писал про container awareness. это та штука за счет которой рантайм может использовать параметры контейнера. за много лет практики мы наверное сотню раз решали инциде...
The Last of 9s
Последний оплот хардкорного SRE. Без воды, только польза! Кулстори, хаки и техгайды про наблюдаемость, перформанс, устойчивость, траблшутинг и все вокруг этого. 🔥 99,99 🔥
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20#кулстори #connectionpool вводные: представим, что есть у нас классный бэкенд, он готов обрабатывать много запросов, он стейтлесс, поэтому мы с вами ожидаем, что мы его легко можем замасштабировать горизонтально. для верности мы даже проведем нагрузочные тесты и по-прежнему все отлично, при пиковой нагрузке добавляем +1 инстанс и выдерживаем её. проблема: запускаем нашего красавчика в проде и дальше видим, что происходит ужасное, у нас в 100% cpu утилизирован 1 под. изучив логи, трейсы и другую ...
ребята, всем привет! знайте - канал не заброшен, контент делается. ниже поделюсь подробностями. но для начала - анонс! пару недель назад случилось для меня эпохальное событие: я сменил работу, и теперь я часть команды VictoriaMetrics! я этому несказанно рад. буду помогать ребятам стать ещё наблюдаемее и устойчивее. что это значит для канала: 1. будет больше постов на английском, сюда буду публиковать свои опенсорсные труды 2. будет больше контента по обсервабилити (готовые дашборды, подходы и ар...
#slo #techtalk #podcast собрались мы тут значит и решили пообщаться на тему SLO под запись и с камерами - ну вдруг это кому-то будет интересно! :) идея пришла после ряда классных дискуссий в нашем уютном SLO-комьюнити. в итоге так увлеклись, что это все превратилось в подкаст. на самом деле пообщались лампово, без крамольных мыслей или шокирующих фактов. на подкасте: - обсудили, как подходим к оценке критичности пользовательского пути - где можно избежать переусложнения в реализации SLO - может ...
наткнулся на занятое наблюдение, хочу с вами поделиться: https://techtrenches.substack.com/p/the-great-software-quality-collapse суть очень простая - качество софта стало глобально ниже. я не очень согласен с категоричностью и кликбейтностью, но с рядом вещей я реально сталкивался. например: - "утечка памяти в кубе не страшна, все равно ж под ребутнется после ООМ" - "а давайте кэшировать ваще все, память же дешёвая" доходило до 200 Гб кэша на инстанс конкретно про память это довольно опасная наи...
анонс для локалов. в попытках улучшить свой английский пробую себя в роли спикера на локальных митапах. для тех кто недалеко от Валенсии - есть удачная возможность пообщаться в живую. https://www.linkedin.com/posts/qa-breakfast_hi-everyone-next-qa-breakfast-will-be-on-activity-7384548975028219904-naVi?utm_source=share&utm_medium=member_desktop&rcm=ACoAABWZLgcBc6KoQA5zL-6tirLS3OqRI7x4xZ0
#performance #talks #podcast #teammanagment каюсь, это не хардкор и кровавое SRE, но, в качестве исключения, представляю вам среднетехнический митап о том как строить команды нагрузочного тестирования. доклад посвящен предстоящему perf conf 11, это моя домашняя площадка, там меня можно найти в программном комитете. много хорошего контента про перформанс и вокруг, но пост не про пиар (хотя за промокодом со скидкой на тикеты заходите в личку), пост про пользу, которая ждёт вас по ссылке ниже: http...
сегодня премьера! моя первая публикация на английском и моя первая публикация в составе victoriametrics team. о чем пойдет речь? вспоминая недавний инцидент с aws us-east-1 многие задумались о том как повышать свою устойчивость архитектурно. я постарался описать самые популярные подходы повышения своей устойчивости от стартапов до гипермасштабных ентерпрайзов в контексте victoriametrics инсталляции. чтоб было не слишком сухо в статью добавил трейдофы и ловушки которые могут поджидать на каждом у...
#sre #ratelimits #кулстори представьте, сидите вы как всегда никого не трогаете, и тут инцидент - все горит, пришла слишком большая нагрузка на систему. каким-то образом удается потушить и сразу переносимся на стадию разбора инцидента. идет брейшторм по тому как выстраивать защиту от таких бед и тут какой чрезвычайно опытный и достопочтенный инженер говорит: "да давайте просто рейтлимиты бахнем и сё!?". ну а мы с вами давайте разбираться, есть ли у нас причины не бахнуть рейтлимитов то? а они ес...
#firstnine #perfguide #sre #observability анонс, который в будущем можно юзать как пост для навигации по контенту. длительное время я собирал "The First Nine Guide" - огромный excalidraw документ, с 9 (символично!?) блоками про базовые вещи, которые необходимы для достижения многодевяток, другими словами вот первая девятка. он начинается от software инженерии плавно переходя в системные слои. я его долго собирал на основе своих граблей, чужих граблей и просто исследований. цикл статей по нему, б...