Очень много пишут о сбоях в Сети.
Удивляются так, как будто видят такое в первый раз и "штожеэтопроисходит". Еще пару лет назад в ковидную эпоху
было понятно, что ландшафт в информационных технологиях меняется, вычислительные ресурсы становятся дороже, а их доступность медленно, но неуклонно снижается.
Если раньше приложение на 100500х жирных фреймворках для отрисовки трех страничек было ok, а предположение о том, что датацентр в другой стране / регионе всегда доступен не подвергалось сомнению, то сегодня уже очевидно, что ChatGPT + хайповый фреймфорк из времен, когда деньги давали просто за бизнес план - не самый эффективный инструмент разработки и ресурсы, если это не самосборный сервер с алиэкспресс в подвале, по щелчку получить не получится, а работающая связность с другим ДЦ это вообще маленькое радостное чудо.
Но человек существо инертное, поэтому эти факты будут приняты массами чуть позже, скорее всего в тот момент, когда колоночка "итого" в документах за аренду серверов или закупках оборудования начнет серьезно огорчать бизнес. И что важно - это все общемировые процессы, поэтому перенос площадки в другой ДЦ/страну/континент/etc может поменять сиюминутный счет, но тренд останется прежним.
Что касается сетей, то уже давно пора переставать питать надежды на стабильность подключений. Кабели рвутся, конфигурации летят в трубу и все отваливается так же неотвратимо как рассвет и закат. И чем дороже оборудование, тем меньше резервирование, поэтому место, по которому дед Фернандо на своем тракторе раньше спокойно проезжал по оптике и мы ничего не замечали, становится источником новостей не только в профильных чатиках на пару сотен человек, но и обычных таких полноценных СМИ.
Сетевую latency и связность тоже уже никто не гарантирует, поэтому если раньше идея натянуть кубер на несколько ДЦ в паре сотен километров друг от друга встречала лишь тихий смех в ладошку, то сейчас - активное вращение пальцем в районе виска.
Что все это значит для индустрии в целом и IT руководства в частности?
Важность грамотного подхода к вычислительным ресурсам, планированию нагрузки, работы над нефукнциональными требованиями, своевременного нагрузочного тестирования и оптимизации в целом неуклонно растет. Ценность и стоимость инженеров способных делать вышеперечисленное так же повышается.
Насколько долго будет продолжаться такой тренд - время покажет, но как минимум еще лет пять точно.
Что еще почитать?
1.
Что такое SRE?
2.
Антипаттерны в DevOps и SRE
3.
Что такое Chaos Engineering?
4.
Культура взаимодействия между DevOps и SRE
5.
Почему падает прод
#SRE #мысливслух
@downtime_bar