Важность балансировки нагрузки

Еще в августе произошла небольшая эпидемия простоев в широком спектре громких имен в общедоступных бесплатных веб-сервисах.

Важность балансировки нагрузки

Некоторое время Google, как и Facebook, казался недоступным, и я ожидаю, что будут и другие случаи, на которые можно указать.

Всех удивляет мысль о том, что такие глобальные сервисы могут когда-либо быть выведены из строя, и предполагается, что должна быть сумасшедшая проблема с комнатами/зданиями/улицами, полными серверов. Даже некоторые опытные сетевики качают головой при мысли о количестве данных и решениях, которые необходимо принять для восстановления после такого сбоя. Я не.

Всех удивляет мысль о том, что такие глобальные сервисы могут когда-либо быть выведены из строя.

Вместо этого я думаю о нескольких визитах и ​​беседах, которые у меня были с людьми, работающими в таком масштабе, и о решающей роли, которую играют некоторые удивительно маленькие, редкие элементы оборудования.

Сними нагрузку

Я имею в виду балансировщики нагрузки: устройства, которые берут трафик, явно нацеленный на один веб-адрес и распределить его по эффективному бесконечному количеству машин в частной сети, принадлежащей службе провайдер. Веб-сайты широко используют эти устройства, поскольку, по-видимому, никто не придумал, как передавать трафик с сервер к серверу — либо так, либо разделение труда между диспетчером трафика и сервером-с-дисками рассматривается как выгодный.

Иногда бывает даже хуже. Я имею в виду, что проблема не только в том, сколько кусков умственной энергии вы можете поместить в блок-схему вашего архитектуре, а то, что базовые сетевые стандарты, которые мы все используем каждый день, не имеют нужных атрибутов, чтобы помочь с работой.

Подумайте об этом сравнении: большинство грузов в наши дни перевозятся автомобильным транспортом, и считается само собой разумеющимся, что размещение товаров так, чтобы они помещались в одну коробку или транспортный контейнер, считается само собой разумеющимся. Там, где груз не помещается ни в один из этих контейнеров, единственный способ переместить его — это нарушить правила — один из моих Фирмы-клиенты перемещают свою крупную продукцию в ближайший порт, проезжая по предварительно сконфигурированному участку дорог с непроходимыми участками. фонарные столбы…

Это очень физический пример изменения правил для преодоления конкретной трудности, и эквивалентные подходы становятся необходимыми в действительно больших развертываниях серверов.

IP-сети в том виде, в каком мы их знаем, не так блестящи, когда дело доходит до управления и направления моделей трафика, с которыми сталкиваются Google или Facebook.

Сети F5

Я встречался с одним из поставщиков комплекта, который выполняет эту работу, еще в начале 2013 года. Она называется F5 Networks и производит относительно небольшие коробки — в одну сетевую стойку поместится четыре, — в которых могут быть сотни устройств. Ethernet-соединений всех скоростей и типов носителей, а также более экзотические способы передачи данных на большие расстояния. стандарты.

Хотя они были немного сдержанны в отношении именитых пользователей и того, что именно они делали с комплектом, им было трудно отрицать, что его самые большие развертывания редко превышали десять живых коробок на одного клиента.

Это означает, что его небольшие развертывания могут иметь только два или три блока. По общему признанию, это довольно некоторая коробка, о которой мы говорим - определенно что-то совсем в другой лиге, чем обычная телекоммуникационная коробка, программируемая через последовательный кабель и допотопный бронированный ноутбук, в палатке наверху гора.

Мы говорим здесь о месяцах размышлений, рисунков и обсуждений перед каждой конфигурацией. изменения, с огромным количеством инструментов, файлов журналов и умопомрачительных интерфейсов между протоколы. Это большая часть работы, чтобы просто привести эти вещи в действие.

Если вы хотите чувствовать себя так же неадекватно, как и я, вы можете быстрый тестовый запуск версии виртуальной машины F5 программного стека балансировщика нагрузки компании.

По словам компании, его можно использовать всего на нескольких тысячах машин. Вы можете взять собранный вами конфиг и загрузить его в физическую версию хэви-метала. Это тоже хорошо, поскольку разрыв в производительности между тем, что может делать виртуальная машина, и тем, что может делать выделенное оборудование, поразителен.

Запуск чисел

Всякий раз, когда вы смотрите на эти огромные общедоступные системы, я бы сказал, что мысли об огромном количестве серверов, на которых вы, возможно, в конечном итоге будете работать, в значительной степени неуместны. Более интересная цифра — сколько балансировщиков нагрузки и преобразователей протоколов вы пройдете по пути.

Удобный текущий тест был непреднамеренно представлен в презентации ИТ-директора NASCAR в этом году на мероприятии, организованном NaviSite. У него было 2,5 миллиона постоянных пользователей, и хотя в системе NASCAR параллельно работает множество серверов, есть только один брандмауэр (по общему признанию, довольно большой и оснащенный более чем двумя обычными соединениями Ethernet), сидящий между ними и нетерпеливыми, страстными и невежливыми полчищами NASCAR фанаты.

Как я уже говорил, большая часть сетевого комплекта не получила выгоды от тепличных разработок, которые сделали ПК и серверы невероятно эффективными за последние полвека или около того.

Довольно много комплектов десятилетней и даже пятнадцатилетней давности до сих пор перелопачивают пакеты, вентиляторы крутятся на максимуме, а блоки питания мучительно гудят.

В конце концов, даже для самых крупных операторов время простоя, связанное с обновлением корневой сети, сократится. стоит того, поскольку появляется новый комплект, в котором используются современные процессоры ARM, более умный код и более эффективная мощность. управление.