Привет,

Как не сойти с ума, чиня прод – практические заметки SRE
Привет, %username%! Иногда кажется, что про надежность уже сказано всё: SLO, error budget, postmortem’ы, Chaos Engineering и вот это всё. Но потом ты открываешь очередной инцидент в проде — и понимаешь, что падает не «абстрактная система», а вполне конкретная «штука», которую ты вчера трогал руками. И вот ты сидишь, смотришь в логи и графики, и главный вопрос звучит примерно так: «А можно было сделать так, чтобы сегодня я спал?» ...

Digital Immune System: цифровой иммунитет твоей инфраструктуры
Привет, %username%! Сегодня поговорим о концепции, которую Gartner включил в топ-10 стратегических технологических трендов — Digital Immune System (DIS), или «Цифровая иммунная система». Звучит футуристично, но на самом деле это про то, как сделать наши системы такими же адаптивными и самовосстанавливающимися, как человеческий организм. ...

Эволюция практик Site Reliability Engineering: краткий анализ тенденций 2020-2025
Привет, %username%! Попытался разобраться, куда катится Site Reliability Engineering (SRE) за последние лет пять. Ниже накидал мысли по этому поводу. Ссылки на все отчеты вроде не забыл, так что зацени, а потом го в комменты – обсудим вместе. ...

Почему тебе НЕ стоит идти работать в АйТи
Привет, %username%! Слушай, прежде чем ты понесёшь свои кровные на очередные курсы «стань программистом за три месяца», давай честно поговорим о том, о чём тебе не расскажут продавцы этих самых курсов. Все эти истории про гибкий график, работу с ноутбуком на Бали и зарплаты в долларах — это как картинки в меню в забегаловке: выглядят аппетитно, а на деле ты получаешь совсем не то, что ожидал. ...

Мониторинг бизнес-метрик: как понять, что твой сервис действительно работает
Привет, %username%! Сегодня поговорим о теме, которая часто остается в тени инфраструктурного мониторинга, но при этом не менее важна — о мониторинге бизнес-метрик. Если ты SRE, DevOps или TeamLead, то наверняка сталкивался с ситуацией: все графики зеленые, CPU не плавится, память в норме, а бизнес приходит и говорит “что-то не работает”. И вот тут начинается самое интересное. ...

Запуск Kali Linux в UTM на macOS под ARM
Привет, %username%! Сегодня я расскажу тебе про то, как можно развернуть Kali Linux на маках с процессорами Apple Silicon (M1/M2/M3), используя бесплатную альтернативу Parallels Desktop — виртуализатор UTM. И да, это не только для пентестеров, но и для всех, кому нужна тестовая среда на базе Linux. ...

Tron как первый SRE
Привет, %username%! В 2010 году в прокат вышел фильм Tron: Наследие. И только с недавних пор, уже работая на позициях Site Reliability Engineer (SRE), я начал считать его (программу Tron) первой имплементацией SRE. ...

Как именно лег «Аэрофлот»
Привет, %username%! Далее будет небольшой разбор нашумевшей истории о сбое информационных систем компании «Аэрофлот». Как именно лег «Аэрофлот» 28 июля 2025 года около 4:30 утра карта сети «Аэрофлота» начала «гаснуть»: рабочие станции перезагружались и превращались в кирпичи, отвалился корпоративный домен, перестали работать SAP ERP, документооборот и ITSM. Хакеры, имея права администратора в AD, разлили через GPO задачу на стирание данных и удар по домену, после чего единственным способом остановить разрушение стало физически рубить каналы связи и электричество целыми этажами. ...

Проект Феникс – не краткие выводы
Привет, %username%! Книгу “Проект Феникс” я прочитал дважды: первый раз я ее читал исключительно как художественное произведение, а во второй раз – делал пометки по каждой главе. И в этой статье я постарался собрать выжимку мыслей, к которым пришел. ...

Хочу программировать на Golang
Привет, %username%! В том или ином виде часто сталкиваюсь с таким вопросом: Вот я слышал, что вам в DevOps/SRE надо программировать! Я вот хочу, но не вижу у себя на работе задач, где можно программировать. А если и вижу, то мне не дают их. ...