Даунтайм в десятую процента: почему зависают «облака» и правда ли дешевле хранить данные локально? Евгений Золотов
Даунтайм в десятую процента: почему зависают «облака» и правда ли дешевле хранить данные локально?
Евгений Золотов
Опубликовано 21 августа 2013
Минута, две, полчаса даунтайма: от такой неприятности не застрахован никто. Даже крупнейшие и старейшие из интернет-бизнесов периодически сталкиваются с неполадками, которые выбрасывают их из Сети. Но произошедшее в последние семь дней больше напоминает эпидемию, нежели череду случайностей. Один за другим, с разницей в сутки–двое, «упали» сайты и сервисы нескольких брендов мирового значения — оставив миллионы пользователей в недоумении, а партнёров и клиентов — не у дел. Самое время задуматься о гарантиях на аптайм…
Первой — устроив своеобразную прелюдию — ушла в офлайн газета New York Times. Веб-сайт одного из информационных столпов англоязычного Веба выключился 14 августа на два часа, и причина не установлена до сих пор. Предполагается, что это не было атакой: просто случайность (система рухнула буквально за минуты до планировавшейся рутинной проверки). Редакция держалась молодцом, сохранив даже чувство юмора (в редакционном «Твиттере» пообещали, что если починить сайт не удастся, то свежие материалы будут публиковаться в 140-символьном формате), что, впрочем, не помешало котировкам издательства рухнуть вниз, а конкурентам (в частности, Wall Street Journal) подсуетиться и переманить к себе часть аудитории, предоставив на ту же самую пару часов бесплатный доступ ко всем своим материалам.
Следующей стала Microsoft, потратившая всю вторую половину недели на попытки восстановить нормальную работоспособность почтовика Outlook.com, облачного накопителя SkyDrive и некоторых других популярных сервисов. Трое суток они пребывали в неадекватном состоянии, отшивая хоть не и всех, но большинство пользователей. Формальную причину поломки как будто установили (из-за нестыковок клиентского и серверного софта получилось что-то вроде самопроизвольного DDoS’а), но восстановительных работ это не ускорило: Outlook вернули в строй только на выходных.
И ещё до того, как Microsoft закончила свой ремонт, эстафету приняла Google. 17 августа «отключились» её центральный сайт и большинство сервисов: Gmail, Drive, Blogger, YouTube, прочие. На протяжении нескольких минут три четверти запросов к серверам Google возвращались с ошибкой. Что-то не работало совсем (поиск), что-то сохранило работоспособность отчасти (насчёт YouTube есть разные сведения), но — факт: по данным как минимум одного стороннего наблюдателя (GoSquared), число просматриваемых пользователями Сети веб-страниц в момент сократилось на 40%. К счастью, апокалипсис оказался недолгим: уже пять минут спустя Google вернулась к норме — однако причина случившегося осталась неизвестной.
Наконец, в этот понедельник блэкаут настиг крупнейшего интернет-ритейлера Amazon.com. И центральный сайт (по крайней мере для США и Канады), и облачные Amazon Web Services (компания, впрочем, настаивает, что их работа не прерывалась, просто возникли трудности с административным доступом) пробыли в отключке полчаса. И были возвращены к жизни опять же без упоминания причин.
Деловая пресса, взбудораженная невиданным стечением обстоятельств, бросилась оценивать ущерб, нанесённый простоем, но, погудев немного, сошлась на том, что он минимален. Amazon, считая по среднестатистическим продажам в минуту, недополучила около трёх миллионов долларов выручки. Google за пять минут недопоказала рекламы на полмиллиона. Всё это, как вы понимаете, едва заметно на фоне миллиардных квартальных оборотов. В случаях же с Microsoft и New York Times основной ущерб и вовсе логичней измерять не деньгами, а репутацией.
Сложней подсчитать убытки клиентов. Сколько, к примеру, потеряли компании, пользующиеся Google Drive, GMail или Outlook, оставшись совсем без или почти без почты и документов на срок от пяти минут до трёх суток?
Впрочем, давайте вернёмся к этому вопросу позже, а пока обратите внимание на странную деталь, объединяющую все перечисленные выше инциденты: причины их не разглашаются (и даже майкрософтовское объяснение кажется скорее PR-отпиской, нежели серьёзным обоснованием). Почему? Либо они ещё не установлены, либо компании не желают выносить сор из избы — выставляя в негативном свете свою ИТ-инфраструктуру. Ведь Amazon, Google, Microsoft — это не три сервера, посаженных на домашний интернет-канал. Google тратит на поддержание и расширение своей инфраструктуры почти полтора миллиарда долларов в квартал, Amazon — ещё больше! Их системы диверсифицированы, продублированы, оптимизированы на случай высоких нагрузок и непредвиденных обстоятельств — и, честно говоря, совершенно непонятно, как могли они разом взять и «сломаться», если слабые места, удар по которым приведёт к поломке сразу всей конструкции, должны отсутствовать у них по определению.
Google гарантирует для своего облака аптайм в 99,9%, что означает около восьми часов непредвиденного простоя в год (запланированные техработы сюда обычно не включаются). Amazon даёт гарантию уже на 99,95% аптайма в месяц. По факту и та и другая обеспечивают даже лучший результат. Достигается это фантастически сложными средствами. Та же Google принципиально держит только серверы собственной разработки с минимально необходимой конфигурацией (читайте: минимумом неизвестных дыр), хранит пользовательские данные в файловых системах с избыточным кодированием, распределёнными по дюжине дата-центров, разбросанных по всем континентам Земли, за исключением Антарктиды (кое-кто, впрочем, считает, что на самом деле гугловских дата-центров в разы больше, просто компания этого не афиширует). Так что ни пожар, ни землетрясение, никакой вообще локальный катаклизм теоретически не в состоянии ни повредить данные, ни тем более «выключить» сервисы Google.
Что ж, тот факт, что такие поломки всё-таки случаются, напоминает: идеал недостижим, даунтайм у облаков будет, и клиенты, от них зависящие, неизбежно будут страдать. Что, в свою очередь, подводит некоторый фундамент под утверждение: облакам никогда не достичь надёжности, сравнимой с локальными системами (только за последние полгода это мнение звучало в комментариях не раз). Но я предлагаю вам задуматься вот над чем. Перекроют ли убытки, причинённые несколькоминутным простоем, скажем, сервисов Google, тех расходов, которые необходимы, чтобы построить дома или в офисе ИТ-инфраструктуру, сравнимую с гугловской по надёжности (обеспечить те самые 99,9% рабочего времени)? Наверняка дешевле потерпеть.
И потом, согласитесь, девять из десяти рядовых компьютерных пользователей, столкнувшись с минутным зависанием их любимого веб-сайта, скорее всего, даже не поймут, где именно проблема. «Не работает интернет»? Позвонить провайдеру или сисадмину, перезагрузить компьютер. Ну а пока загрузится, сайт уже и починили.
К оглавлению
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Проклятье аккумуляции, или Почему не слышно про супермаховик? Евгений Золотов
Проклятье аккумуляции, или Почему не слышно про супермаховик? Евгений Золотов Опубликовано 17 октября 2013 Если позволите каплю эмоций, я не перестаю удивляться, какие страсти разгораются каждый раз, когда разговор в этой колонке заходит о «чистой
ТВ на заказ: как Intel строила главный ТВ-сервис Америки, почему не получилось и почему может получиться у нас Евгений Золотов
ТВ на заказ: как Intel строила главный ТВ-сервис Америки, почему не получилось и почему может получиться у нас Евгений Золотов Опубликовано 29 ноября 2013 Нечасто, но случается, некоторое событие остаётся незамеченным несправедливо — потому только, что
Правда ли, что «Связка ключей iCloud» может не хранить данные на сервере, или Не верь написанному Олег Нечай
Правда ли, что «Связка ключей iCloud» может не хранить данные на сервере, или Не верь написанному Олег Нечай Опубликовано 30 октября 2013 Среди нововведений очередной версии операционной системы Apple OS X (начиная с 2012 года она официально называется
Хранить бы вечно, но... Возможно ли сохранить старые компьютеры? Евгений Золотов
Хранить бы вечно, но... Возможно ли сохранить старые компьютеры? Евгений Золотов Опубликовано 19 декабря 2013 Мы считаем само собой разумеющейся необходимость сохранения культурного наследия человечества. Литература, картины, музыкальные
Милого узнаю по геному: почему Америка так боится ДНК-отпечатков (и почему не боимся мы) Евгений Золотов
Милого узнаю по геному: почему Америка так боится ДНК-отпечатков (и почему не боимся мы) Евгений Золотов Опубликовано 06 июня 2013 Биометрическая идентификация — штука замечательная, но непростая. В теории, по физиологическим особенностям, присущим
Жива ещё моя старушка! Почему Windows XP до сих пор ТАК популярна Евгений Золотов
Жива ещё моя старушка! Почему Windows XP до сих пор ТАК популярна Евгений Золотов Опубликовано 16 августа 2013 В списке айтишных чудес есть одно, превосходящее любые другие своими размерами. Это Windows XP. Бывшая популярнейшей операционной системой для PC на
Sony прощается с персоналкой. Но почему? Евгений Золотов
Sony прощается с персоналкой. Но почему? Евгений Золотов Опубликовано 12 февраля 2014 За два года непрерывно падающих продаж ПК мы навидались всякого. Но пришедшее на днях известие из Японии всё равно стоит особняком: PC-бизнес покидает Sony. Тот чуть ли
Как 3D-печать помогла скиммерам и почему это важно для нас Евгений Золотов
Как 3D-печать помогла скиммерам и почему это важно для нас Евгений Золотов Опубликовано 23 августа 2013 Сегодня мы не мыслим жизни без двигателя внутреннего сгорания — и предложи кто-нибудь вернуться к паровой машине, рассмеёмся ему в лицо. Мало кто
Крадите, оплачено! Почему мы получаем данные с марсохода Curiosity последними? Евгений Золотов
Крадите, оплачено! Почему мы получаем данные с марсохода Curiosity последними? Евгений Золотов Опубликовано 01 октября 2013 В мире науки едва ли найдётся другой эксперимент, сравнимый по величине с экспедицией марсохода Curiosity. Эта «лаборатория на
В полёт без ограничений: правда ли мобильник опасен для самолёта и можно ли это исправить? Евгений Золотов
В полёт без ограничений: правда ли мобильник опасен для самолёта и можно ли это исправить? Евгений Золотов Опубликовано 26 июня 2013 «Дамы и господа, в целях вашей безопасности просим убедиться, что на время взлёта все электронные приборы выключены».
Порно, сэр! Почему Великобритания не cможет «выключить клубничку» Евгений Золотов
Порно, сэр! Почему Великобритания не cможет «выключить клубничку» Евгений Золотов Опубликовано 01 августа 2013 С порнографией в Сети связано одно железное правило: не хочешь неприятностей — держись подальше. И справедливо оно не только для рядовых
Мрачные итоги Pwn2Own: почему браузеры так легко взломать и почему линуксоидам можно волноваться меньше? Евгений Золотов
Мрачные итоги Pwn2Own: почему браузеры так легко взломать и почему линуксоидам можно волноваться меньше? Евгений Золотов Опубликовано 11 марта 2013 В английском айтишном жаргоне есть словечко «pwned», перевести которое на русский можно таким же коротким «поимели». Грубо,
Почему Google уничтожает свой Reader — и почему это хорошо? Евгений Золотов
Почему Google уничтожает свой Reader — и почему это хорошо? Евгений Золотов Опубликовано 15 марта 2013 Когда в среду руководители Google ставили точку в истории одного из своих многочисленных веб-сервисов, едва ли они могли вообразить, какая реакция за этим последует. Согласно
Фотографическая правда: телефон лучше зеркалки! Евгений Золотов
Фотографическая правда: телефон лучше зеркалки! Евгений Золотов Опубликовано 15 мая 2014 Доводилось ли вам наблюдать, как обыватель — в смысле, «человек с улицы», имеющий от слабого до никакого представления об устройстве сложной электроники, —
Как ломали Нью-Йорк Таймс (и почему не работают антивирусы)? Евгений Золотов
Как ломали Нью-Йорк Таймс (и почему не работают антивирусы)? Евгений Золотов Опубликовано 04 февраля 2013 Эти выходные западная пресса провела без сна — и тому есть хорошая причина: всю минувшую неделю, один за другим, всплывали факты проникновения таинственных взломщиков
Красное на звёздно-полосатом: почему Huawei уходит из США? Евгений Золотов
Красное на звёздно-полосатом: почему Huawei уходит из США? Евгений Золотов Опубликовано 26 апреля 2013Huawei Technologies покидает Америку. Один из крупнейших производителей телекоммуникационного оборудования на планете — а кто-то считает, что и самый крупный — «более не