Глобальный сбой Facebook: разбираем кейс с украинскими экспертами

Мы поговорили с украинскими экспертами, которые подробно объяснили, что могло произойти с Facebook и Instagram

Вечером 4 октября сотни миллионов людей по всему миру не знали, чем заняться в транспорте или во время перекура – Facebook, Instagram и мессенджер WhatsApp не работали.

Глобальный сбой продолжался более шести часов – пользователи не могли обновить ленту новостей и зайти в свои аккаунты. Глава Facebook Марк Цукерберг уже извинился перед пользователями соцсетей компании и WhatsApp. Из-за сбоя его состояние уменьшилось почти на $7 миллиардов.

Facebook в своем официальном блоге сообщил, что шестичасовое отключение, которое привело к глобальному сбою в Facebook, Instagram и WhatsApp, было результатом «изменения конфигурации магистральных маршрутизаторов, которые координируют сетевой трафик между нашими центрами обработки данных», а не взлома или попытки получить пользовательские данные. Каких-то технических подробностей нам не сообщают, но, похоже, что серверы Facebook не смогли общаться друг с другом. В Facebook утверждают, что «это нарушение сетевого трафика обусловило каскадное влияние на способы связи наших центров обработки данных, в результате чего наши сервисы перестали работать».

Мы поговорили с украинскими экспертами, которые подробно объяснили, что могло произойти с Facebook и Instagram.

«Точную причину никто не знает, но выглядит это как сбой сети. Когда у вас большая сеть, вы создаете инструмент централизованного управления ею. И выходит, что управляете сетью с помощью сети, используя ее для передачи команд. Есть такой тип ошибок, в результате которых эта сеть падает. Исправить эту ошибку может быть очень легко и просто, но для этого нужно передать команду на удаленное устройство, а без сети это невозможно. Похоже на то, что Facebook столкнулся именно с такой ошибкой», – рассказал президент холдинга Internet Invest Group, один из «отцов-основателей» украинского интернета Александр Ольшанский. – «Чем сложнее сеть, тем опаснее ошибка. Обычно мы все ответственные устройства в своих сетях снабжаем альтернативным каналом связи, например, 4G-модемом.

И тогда, даже если у вас все развалилось, через этот тоненький канал вы можете добраться до ошибки и исправить ее. А Facebook пришлось отправлять сотрудников, чтобы вручную добраться до серверов. Это очень непростая история, когда у вас тысячи устройств и вы привыкли управлять ими удаленно. А потом вам нужно поехать в 20 или 50 мест и исправить ошибку, учитывая, что там важна последовательность – что раньше, что позже. На самом деле сетевым специалистам известны такие случаи, и они страхуются. Видимо, в Facebook сделали что-то не так. Обычно после подобной аварии проходит работа над ошибками, на которую уйдут недели. При такой серьезной аварии сложно выявить первопричины».

О возможной ошибке, которая привела к сбою Facebook, рассказал Антон Яковлев, эксперт, работающий в области сетевой инженерии и коммуникаций более 10 лет.

«Весь мировой интернет работает благодаря возможности превращения понятных для пользователя доменных имен вроде www.facebook.com в ip-адреса, «понятные» технике. Они выглядят, например, как 157.240.224.35. За эту трансформацию отвечают корневые DNS-сервера (Domain Name System – система доменных имен), обеспечивающие работу в масштабах всего мира. Частные компании, такие как Facebook, могут устанавливать собственные DNS-сервера или маршрутизаторы, которые ускорят доступ пользователей к ресурсам этих компаний, сбалансируют нагрузки и будут управлять потоками клиентов, – рассказал Антон.

В официальном блоге Facebook сообщили, что сбой случился из-за того, что изменилась конфигурация магистральных маршрутизаторов, координирующих сетевой трафик между центрами обработки данных. То есть маршрутизаторы перестали выполнять свою работу – в том числе превращать доменные имена в IP-адреса, и вся система легла. Сообщалось, что сотрудники Facebook не могли попасть в офис, потому что у них не работали электронные пропуска. Это произошло из-за того, что система безопасности компании скорее всего работает на хосте с условным доменом 123.security.facebook.com и при таком глобальном сбое доменное имя просто не могло быть обработано DNS-инфраструктурой Facebook».

Читайте также
Между безопасностью и прибылью Facebook выбирает второе – бывшая сотрудница компании

https://s3.eu-central-1.amazonaws.com/media.my.ua/feed/432/624ab9479e3a9ef14d1a1008b31c4543.jpg

Лев Шевченко

Если Вы заметили орфографическую ошибку, выделите её мышью и нажмите Ctrl+Enter.

0

Напишите нам

facebook WhatsApp instagram

Вакансии
Больше вакансий

PR-менеджера з зовнішніх та внутрішніх комунікацій

Киев

Група Компаній ЛІГА

Разместить вакансию