30 жовтня 2025 р.Українська

Дізнайтеся про методи обмеження швидкості Python, порівнюючи алгоритми Token Bucket і Sliding Window для захисту API та керування трафіком.

Обмеження швидкості Python: Token Bucket проти Sliding Window – вичерпний посібник

У сучасному взаємопов’язаному світі надійні API мають вирішальне значення для успіху програми. Однак неконтрольований доступ до API може призвести до перевантаження сервера, погіршення якості обслуговування та навіть атак типу «відмова в обслуговуванні» (DoS). Обмеження швидкості – це важлива техніка для захисту ваших API, обмежуючи кількість запитів, які користувач або служба може зробити протягом певного періоду часу. У цій статті розглядаються два популярні алгоритми обмеження швидкості в Python: Token Bucket і Sliding Window, надаючи всебічне порівняння та практичні приклади реалізації.

Чому обмеження швидкості має значення

Обмеження швидкості пропонує численні переваги, зокрема:

Запобігання зловживанням: Обмежує зловмисних користувачів або ботів від перевантаження ваших серверів надмірними запитами.
Забезпечення чесного використання: Розподіляє ресурси справедливо між користувачами, запобігаючи монополізації системи одним користувачем.
Захист інфраструктури: Захищає ваші сервери та бази даних від перевантаження та збоїв.
Контроль витрат: Запобігає несподіваним стрибкам споживання ресурсів, що призводить до економії витрат.
Покращення продуктивності: Підтримує стабільну продуктивність, запобігаючи виснаженню ресурсів і забезпечуючи стабільний час відповіді.

Розуміння алгоритмів обмеження швидкості

Існує кілька алгоритмів обмеження швидкості, кожен зі своїми сильними та слабкими сторонами. Ми зосередимось на двох найбільш часто використовуваних алгоритмах: Token Bucket і Sliding Window.

1. Алгоритм Token Bucket

Алгоритм Token Bucket – це проста і широко використовувана техніка обмеження швидкості. Він працює, підтримуючи «відро», яке містить токени. Кожен токен представляє дозвіл на здійснення одного запиту. Відро має максимальну місткість, і токени додаються до відра з фіксованою швидкістю.

Коли надходить запит, обмежувач швидкості перевіряє, чи достатньо токенів у відрі. Якщо так, запит дозволяється, і відповідна кількість токенів видаляється з відра. Якщо відро порожнє, запит відхиляється або затримується, доки не з’явиться достатньо токенів.

Реалізація Token Bucket в Python

Ось базова реалізація алгоритму Token Bucket в Python з використанням модуля threading для керування паралелізмом:


import time
import threading

class TokenBucket:
    def __init__(self, capacity, fill_rate):
        self.capacity = float(capacity)
        self._tokens = float(capacity)
        self.fill_rate = float(fill_rate)
        self.last_refill = time.monotonic()
        self.lock = threading.Lock()

    def _refill(self):
        now = time.monotonic()
        delta = now - self.last_refill
        tokens_to_add = delta * self.fill_rate
        self._tokens = min(self.capacity, self._tokens + tokens_to_add)
        self.last_refill = now

    def consume(self, tokens):
        with self.lock:
            self._refill()
            if self._tokens >= tokens:
                self._tokens -= tokens
                return True
            return False

# Example Usage
bucket = TokenBucket(capacity=10, fill_rate=2)  # 10 tokens, refill at 2 tokens per second

for i in range(15):
    if bucket.consume(1):
        print(f"Request {i+1}: Allowed")
    else:
        print(f"Request {i+1}: Rate Limited")
    time.sleep(0.2)

Пояснення:

TokenBucket(capacity, fill_rate): Ініціалізує відро з максимальною місткістю та швидкістю заповнення (токени за секунду).
_refill(): Заповнює відро токенами на основі часу, що минув з моменту останнього заповнення.
consume(tokens): Намагається спожити вказану кількість токенів. Повертає True, якщо успішно (запит дозволено), False інакше (швидкість запиту обмежена).
Блокування потоків: Використовує блокування потоків (self.lock) для забезпечення безпеки потоків у паралельних середовищах.

Переваги Token Bucket

Простий у реалізації: Відносно простий для розуміння та реалізації.
Обробка сплесків: Може обробляти випадкові сплески трафіку, якщо відро має достатньо токенів.
Налаштовуваність: Місткість і швидкість заповнення можна легко налаштувати відповідно до конкретних вимог.

Недоліки Token Bucket

Не ідеально точний: Може дозволити трохи більше запитів, ніж налаштовано, через механізм заповнення.
Налаштування параметрів: Потребує ретельного вибору місткості та швидкості заповнення для досягнення бажаної поведінки обмеження швидкості.

2. Алгоритм Sliding Window

Алгоритм Sliding Window – це більш точна техніка обмеження швидкості, яка ділить час на вікна фіксованого розміру. Він відстежує кількість запитів, зроблених у кожному вікні. Коли надходить новий запит, алгоритм перевіряє, чи не перевищує кількість запитів у поточному вікні ліміт. Якщо так, запит відхиляється або затримується.

«Ковзаючий» аспект походить від того, що вікно рухається вперед у часі, коли надходять нові запити. Коли поточне вікно закінчується, починається нове вікно, і лічильник скидається. Існує два основних варіанти алгоритму Sliding Window: Sliding Log і Fixed Window Counter.

2.1. Sliding Log

Алгоритм Sliding Log веде журнал із позначками часу кожного запиту, зробленого протягом певного часового вікна. Коли надходить новий запит, він підсумовує всі запити в журналі, які потрапляють у вікно, і порівнює це з обмеженням швидкості. Це точно, але може бути дорогим з точки зору пам’яті та обчислювальної потужності.

2.2. Fixed Window Counter

Алгоритм Fixed Window Counter ділить час на фіксовані вікна та веде лічильник для кожного вікна. Коли надходить новий запит, алгоритм збільшує лічильник для поточного вікна. Якщо лічильник перевищує ліміт, запит відхиляється. Це простіше, ніж ковзаючий журнал, але це може дозволити сплеск запитів на межі двох вікон.

Реалізація Sliding Window в Python (Fixed Window Counter)

Ось реалізація алгоритму Sliding Window в Python з використанням підходу Fixed Window Counter:


import time
import threading

class SlidingWindowCounter:
    def __init__(self, window_size, max_requests):
        self.window_size = window_size  # seconds
        self.max_requests = max_requests
        self.request_counts = {}
        self.lock = threading.Lock()

    def is_allowed(self, client_id):
        with self.lock:
            current_time = int(time.time())
            window_start = current_time - self.window_size

            # Clean up old requests
            self.request_counts = {ts: count for ts, count in self.request_counts.items() if ts > window_start}

            total_requests = sum(self.request_counts.values())

            if total_requests < self.max_requests:
                self.request_counts[current_time] = self.request_counts.get(current_time, 0) + 1
                return True
            else:
                return False


# Example Usage
window_size = 60  # 60 seconds
max_requests = 10  # 10 requests per minute
rate_limiter = SlidingWindowCounter(window_size, max_requests)

client_id = "user123"

for i in range(15):
    if rate_limiter.is_allowed(client_id):
        print(f"Request {i+1}: Allowed")
    else:
        print(f"Request {i+1}: Rate Limited")
    time.sleep(5)

Пояснення:

SlidingWindowCounter(window_size, max_requests): Ініціалізує розмір вікна (в секундах) і максимальну кількість запитів, дозволених у вікні.
is_allowed(client_id): Перевіряє, чи дозволено клієнту робити запит. Він очищає старі запити за межами вікна, підсумовує решту запитів і збільшує лічильник для поточного вікна, якщо ліміт не перевищено.
self.request_counts: Словник, який зберігає позначки часу запитів та їхні лічильники, що дозволяє агрегувати та очищати старіші запити
Блокування потоків: Використовує блокування потоків (self.lock) для забезпечення безпеки потоків у паралельних середовищах.

Переваги Sliding Window

Більш точний: Забезпечує більш точне обмеження швидкості, ніж Token Bucket, особливо реалізація Sliding Log.
Запобігає сплескам на межі: Зменшує ймовірність сплесків на межі двох часових вікон (ефективніше з Sliding Log).

Недоліки Sliding Window

Більш складний: Більш складний для реалізації та розуміння порівняно з Token Bucket.
Вищі витрати: Може мати вищі витрати, особливо реалізація Sliding Log, через необхідність зберігати та обробляти журнали запитів.

Token Bucket vs. Sliding Window: Детальне порівняння

Ось таблиця, що підсумовує основні відмінності між алгоритмами Token Bucket і Sliding Window:

Функція	Token Bucket	Sliding Window
Складність	Простіший	Більш складний
Точність	Менш точний	Більш точний
Обробка сплесків	Добре	Добре (особливо Sliding Log)
Витрати	Нижчі	Вищі (особливо Sliding Log)
Зусилля для реалізації	Легше	Важче

Вибір правильного алгоритму

Вибір між Token Bucket і Sliding Window залежить від ваших конкретних вимог і пріоритетів. Врахуйте наступні фактори:

Точність: Якщо вам потрібне дуже точне обмеження швидкості, алгоритм Sliding Window, як правило, є кращим.
Складність: Якщо пріоритетом є простота, алгоритм Token Bucket є хорошим вибором.
Продуктивність: Якщо продуктивність має вирішальне значення, ретельно врахуйте витрати алгоритму Sliding Window, особливо реалізацію Sliding Log.
Обробка сплесків: Обидва алгоритми можуть обробляти сплески трафіку, але Sliding Window (Sliding Log) забезпечує більш послідовне обмеження швидкості за умов сплесків.
Масштабованість: Для дуже масштабованих систем розгляньте можливість використання розподілених методів обмеження швидкості (описано нижче).

У багатьох випадках алгоритм Token Bucket забезпечує достатній рівень обмеження швидкості з відносно низькою вартістю реалізації. Однак для програм, які вимагають більш точного обмеження швидкості та можуть терпіти підвищену складність, алгоритм Sliding Window є кращим варіантом.

Розподілене обмеження швидкості

У розподілених системах, де кілька серверів обробляють запити, часто потрібен централізований механізм обмеження швидкості для забезпечення узгодженого обмеження швидкості на всіх серверах. Для розподіленого обмеження швидкості можна використовувати кілька підходів:

Централізоване сховище даних: Використовуйте централізоване сховище даних, наприклад Redis або Memcached, для зберігання стану обмеження швидкості (наприклад, лічильники токенів або журнали запитів). Усі сервери отримують доступ і оновлюють спільне сховище даних для забезпечення обмеження швидкості.
Обмеження швидкості балансувальника навантаження: Налаштуйте свій балансувальник навантаження для виконання обмеження швидкості на основі IP-адреси, ідентифікатора користувача або інших критеріїв. Цей підхід може розвантажити обмеження швидкості з ваших серверів додатків.
Спеціальна служба обмеження швидкості: Створіть спеціальну службу обмеження швидкості, яка обробляє всі запити обмеження швидкості. Цю службу можна масштабувати незалежно та оптимізувати для продуктивності.
Обмеження швидкості на стороні клієнта: Хоча це не основний захист, повідомте клієнтам про їхні обмеження швидкості за допомогою HTTP-заголовків (наприклад, X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset). Це може заохотити клієнтів до самостійного регулювання та зменшити непотрібні запити.

Ось приклад використання Redis з алгоритмом Token Bucket для розподіленого обмеження швидкості:


import redis
import time

class RedisTokenBucket:
    def __init__(self, redis_client, bucket_key, capacity, fill_rate):
        self.redis_client = redis_client
        self.bucket_key = bucket_key
        self.capacity = capacity
        self.fill_rate = fill_rate

    def consume(self, tokens):
        now = time.time()
        capacity = self.capacity
        fill_rate = self.fill_rate

        # Lua script to atomically update the token bucket in Redis
        script = '''
        local bucket_key = KEYS[1]
        local capacity = tonumber(ARGV[1])
        local fill_rate = tonumber(ARGV[2])
        local tokens_to_consume = tonumber(ARGV[3])
        local now = tonumber(ARGV[4])

        local last_refill = redis.call('get', bucket_key .. ':last_refill')
        if not last_refill then
            last_refill = now
            redis.call('set', bucket_key .. ':last_refill', now)
        else
            last_refill = tonumber(last_refill)
        end

        local tokens = redis.call('get', bucket_key .. ':tokens')
        if not tokens then
            tokens = capacity
            redis.call('set', bucket_key .. ':tokens', capacity)
        else
            tokens = tonumber(tokens)
        end

        -- Refill the bucket
        local time_since_last_refill = now - last_refill
        local tokens_to_add = time_since_last_refill * fill_rate
        tokens = math.min(capacity, tokens + tokens_to_add)

        -- Consume tokens
        if tokens >= tokens_to_consume then
            tokens = tokens - tokens_to_consume
            redis.call('set', bucket_key .. ':tokens', tokens)
            redis.call('set', bucket_key .. ':last_refill', now)
            return 1  -- Success
        else
            return 0  -- Rate limited
        end
        '''

        # Execute the Lua script
        consume_script = self.redis_client.register_script(script)
        result = consume_script(keys=[self.bucket_key], args=[capacity, fill_rate, tokens, now])
        return result == 1


# Example Usage
redis_client = redis.StrictRedis(host='localhost', port=6379, db=0)
bucket = RedisTokenBucket(redis_client, bucket_key='my_api:user123', capacity=10, fill_rate=2)

for i in range(15):
    if bucket.consume(1):
        print(f"Request {i+1}: Allowed")
    else:
        print(f"Request {i+1}: Rate Limited")
    time.sleep(0.2)

Важливі міркування для розподілених систем:

Атомарність: Переконайтеся, що операції споживання токенів або підрахунку запитів є атомарними, щоб запобігти гонкам. Скрипти Redis Lua забезпечують атомарні операції.
Затримка: Мінімізуйте затримку мережі під час доступу до централізованого сховища даних.
Масштабованість: Виберіть сховище даних, яке можна масштабувати для обробки очікуваного навантаження.
Узгодженість даних: Вирішіть потенційні проблеми з узгодженістю даних у розподілених середовищах.

Реальні приклади

Twitter: Twitter широко використовує обмеження швидкості для захисту свого API від зловживань і забезпечення чесного використання. Вони надають детальну документацію щодо своїх обмежень швидкості та використовують заголовки HTTP, щоб інформувати розробників про їхній стан обмеження швидкості.
GitHub: GitHub також використовує обмеження швидкості для запобігання зловживанням і підтримки стабільності свого API. Вони використовують комбінацію обмежень швидкості на основі IP-адреси та користувача.
Stripe: Stripe використовує обмеження швидкості для захисту свого API обробки платежів від шахрайських дій і забезпечення надійної послуги для своїх клієнтів.
Платформи електронної комерції: Багато платформ електронної комерції використовують обмеження швидкості для захисту від атак ботів, які намагаються зібрати інформацію про продукт або здійснити атаки типу «відмова в обслуговуванні» під час раптових розпродажів.
Фінансові установи: Фінансові установи впроваджують обмеження швидкості на своїх API, щоб запобігти несанкціонованому доступу до конфіденційних фінансових даних і забезпечити відповідність нормативним вимогам.

Висновок

Обмеження швидкості є важливою технікою для захисту ваших API та забезпечення стабільності та надійності ваших програм. Алгоритми Token Bucket і Sliding Window є двома популярними варіантами, кожен зі своїми сильними та слабкими сторонами. Розуміючи ці алгоритми та дотримуючись найкращих практик, ви можете ефективно впровадити обмеження швидкості у своїх програмах Python і створити більш стійкі та безпечні системи. Пам’ятайте, що потрібно враховувати свої конкретні вимоги, ретельно вибирати відповідний алгоритм і відстежувати свою реалізацію, щоб переконатися, що вона відповідає вашим потребам. У міру масштабування вашої програми розгляньте можливість впровадження розподілених методів обмеження швидкості для підтримки узгодженого обмеження швидкості на всіх серверах. Не забувайте про важливість чіткого спілкування зі споживачами API за допомогою заголовків обмеження швидкості та інформативних повідомлень про помилки.