Балансировщики нагрузки и обратные прокси: распределение т... | Вопросы для собеседования

Сеть Новичок Опубликовано

Балансировщики нагрузки и обратные прокси: распределение трафика и обработка запросов

#HighAvailability #Reliability #Protocols #HTTP #QoS

Вопрос:

Что такое балансировщик нагрузки и как он помогает веб-приложениям?

Объясните разницу между балансировщиком нагрузки и обратным прокси (reverse proxy), включая их ключевые функции в инфраструктуре распределенной системы.

Подсказки:

Подумайте о том, как трафик распределяется между несколькими серверами.
Давайте рассмотрим сценарии, в которых требуется высокая доступность и отказоустойчивость.
Какие алгоритмы балансировки нагрузки вы знаете для распределения трафика?
Как опубликовать два веб-приложения по одному адресу и разным URL-путям на одном домене?

Выше ожиданий:

Понимание терминации TLS на уровне балансировщика нагрузки.
Опыт реализации рейт лимититера.
Знания по модификации HTTP-заголовков и другим манипуляциям на уровне протокола с помощью реверс прокси.
Знания организации аутентификации через реверс прокси.
Опыт работы с решениями балансировки нагрузки, такими как NGINX, HAProxy, Traefik или от облачных провайдеров.

Ответ:

Балансировщик нагрузки — это устройство или сервис, который распределяет входящий сетевой трафик между несколькими серверами. Балансировщики нагрузки оптимизируют использование ресурсов, максимизируют пропускную способность и предотвращает отказы сервиса для конечного пользователя.

Как работают балансировщики нагрузки

Балансировщики нагрузки находятся между клиентами и серверами-приложениям, принимая все входящие запросы и направляя их на подходящие сервера, используя различные алгоритмы:

Round Robin: Запросы распределяются последовательно по пулу серверов
Least Connections: Новые запросы направляются на сервер с наименьшим количеством активных соединений
IP Hash: IP-адрес клиента определяет, какой сервер получит запрос
Взвешенные алгоритмы: Серверы с большей мощностью получают больше запросов

Пример конфигурации в NGINX:

upstream backend {
    server backend1.example.com weight=3;
    server backend2.example.com;
    server backend3.example.com;
}

Преимущества для веб-приложений

Высокая доступность: Если один сервер выходит из строя, трафик перенаправляется на работоспособные серверы
Масштабируемость: Легко добавлять или удалять серверы по мере изменения потребностей
Эффективность: Оптимальное распределение рабочей нагрузки по инфраструктуре, чтобы избежать перезгрузок и недоутилизации отдельных серверов
Безопасность: Может обеспечивать частичную защиту от DDoS-атак

Балансировщик нагрузки vs обратный прокси

Ключевые функции reverse proxy

Фильтрация содержимого: Проверка и потенциальная модификация трафика
Переписывание URL: Изменение URL запросов перед пересылкой на серверы-обработчики
Терминация SSL: Обработка шифрования/расшифрования для разгрузки серверов-обработчиков
Аутентификация: Может реализовывать механизмы аутентификации перед тем, как запросы достигнут серверов-приложений
Кэширование: Снижения нагрузки на серверы-обработчики

Хотя они выглядят похожими, их основные цели различаются:

Характеристика	Балансировщик нагрузки	Обратный прокси
Основная цель	Распределение трафика для масштабируемости и надежности	Выступает в качестве промежуточного сервера для обеспечения безопасности и функциональности
Использование протоколов	Может работать на уровне 4 (TCP/IP) или уровне 7 (HTTP)	Обычно работает на уровне 7
Маршрутизация на основе URL	Ограничена на уровне 4, возможна на уровне 7	Основная функция
Модификация содержимого	Обычно невозможна	Может модифицировать запросы/ответы

Публикация нескольких приложений на одном домене

Мы должны настроить сервер reverse прокси, который:

Слушает порты 80/443
Обрабатывает указанный домен (example.com)
Определяет два маршрута по пути URL
Каждый маршрут перенаправляет трафик в соответствующее приложение

Пример конфигурации в NGINX:

server {
    listen 80;
    server_name example.com;

    location /app1 {
        proxy_pass http://app1-servers;
    }

    location /app2 {
        proxy_pass http://app2-servers;
    }
}

Дополнительные возможности балансировщиков

Терминация TLS: Балансировщики нагрузки могут обрабатывать шифрование/расшифрование, уменьшая вычислительную нагрузку на серверы-обработчики
Rate limiter: Управление количеством запросов, которые клиенты могут отправлять за определенный период времени
Поддержка сеансов: Обеспечение того, что клиент подключается к одному и тому же серверу-обработчику для всех запросов в сессии если это необходимо
Проверка состояния: Активное отслеживание состояния доступности серверов-приложений и прекращение маршрутизации запросов к неисправным серверам

Популярные реализации включают NGINX, HAProxy, Traefik, AWS ELB/ALB и Google Cloud Load Balancing.