15. september 2025Dansk

En omfattende guide til concurrent.futures-modulet i Python, der sammenligner ThreadPoolExecutor og ProcessPoolExecutor til parallel opgaveudførelse, med praktiske eksempler.

Lås op for samtidighed i Python: ThreadPoolExecutor vs. ProcessPoolExecutor

Python, som er et alsidigt og udbredt programmeringssprog, har visse begrænsninger, når det kommer til ægte parallelitet på grund af Global Interpreter Lock (GIL). Modulet concurrent.futures tilbyder en grænseflade på højt niveau til asynkront at udføre "callables", hvilket giver en måde at omgå nogle af disse begrænsninger og forbedre ydeevnen for specifikke typer opgaver. Dette modul indeholder to vigtige klasser: ThreadPoolExecutor og ProcessPoolExecutor. Denne omfattende guide vil udforske begge, fremhæve deres forskelle, styrker og svagheder og give praktiske eksempler, der hjælper dig med at vælge den rigtige executor til dine behov.

Forståelse af Samtidighed og Parallelitet

Før vi dykker ned i detaljerne for hver executor, er det afgørende at forstå begreberne samtidighed og parallelitet. Disse termer bruges ofte i flæng, men de har forskellige betydninger:

Samtidighed: Handler om at håndtere flere opgaver på samme tid. Det handler om at strukturere din kode til at håndtere flere ting tilsyneladende samtidigt, selvom de faktisk er flettet sammen på en enkelt processorkerne. Tænk på det som en kok, der styrer flere gryder på et enkelt komfur – de koger ikke alle på *præcis* samme tidspunkt, men kokken styrer dem alle.
Parallelitet: Involverer faktisk at udføre flere opgaver på *samme* tid, typisk ved at udnytte flere processorkerner. Dette er som at have flere kokke, der hver især arbejder på en forskellig del af måltidet samtidigt.

Pythons GIL forhindrer i høj grad ægte parallelitet for CPU-bundne opgaver, når der bruges tråde. Dette skyldes, at GIL kun tillader én tråd at have kontrol over Python-interpreteren ad gangen. Men for I/O-bundne opgaver, hvor programmet bruger det meste af sin tid på at vente på eksterne operationer som netværksanmodninger eller diskreads, kan tråde stadig give betydelige forbedringer i ydeevnen ved at tillade andre tråde at køre, mens den ene venter.

Introduktion til `concurrent.futures`-modulet

Modulet concurrent.futures forenkler processen med at udføre opgaver asynkront. Det giver en grænseflade på højt niveau til at arbejde med tråde og processer, og abstraherer meget af den kompleksitet, der er involveret i at administrere dem direkte. Kernebegrebet er "executor", som styrer udførelsen af indsendte opgaver. De to primære executors er:

ThreadPoolExecutor: Udnytter en pulje af tråde til at udføre opgaver. Velegnet til I/O-bundne opgaver.
ProcessPoolExecutor: Udnytter en pulje af processer til at udføre opgaver. Velegnet til CPU-bundne opgaver.

ThreadPoolExecutor: Udnyttelse af tråde til I/O-bundne opgaver

ThreadPoolExecutor opretter en pulje af arbejdståde til at udføre opgaver. På grund af GIL er tråde ikke ideelle til beregningstunge operationer, der drager fordel af ægte parallelitet. De udmærker sig dog i I/O-bundne scenarier. Lad os undersøge, hvordan man bruger det:

Grundlæggende brug

Her er et simpelt eksempel på brug af ThreadPoolExecutor til at downloade flere websider samtidigt:


import concurrent.futures
import requests
import time

urls = [
    "https://www.example.com",
    "https://www.google.com",
    "https://www.wikipedia.org",
    "https://www.python.org"
]


def download_page(url):
    try:
        response = requests.get(url, timeout=5)
        response.raise_for_status() # Raise HTTPError for bad responses (4xx or 5xx)
        print(f"Downloaded {url}: {len(response.content)} bytes")
        return len(response.content)
    except requests.exceptions.RequestException as e:
        print(f"Error downloading {url}: {e}")
        return 0


start_time = time.time()
with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
    # Submit each URL to the executor
    futures = [executor.submit(download_page, url) for url in urls]

    # Wait for all tasks to complete
    total_bytes = sum(future.result() for future in concurrent.futures.as_completed(futures))

print(f"Total bytes downloaded: {total_bytes}")
print(f"Time taken: {time.time() - start_time:.2f} seconds")

Forklaring:

Vi importerer de nødvendige moduler: concurrent.futures, requests og time.
Vi definerer en liste over URL'er til download.
Funktionen download_page henter indholdet af en given URL. Fejlhåndtering er inkluderet ved hjælp af `try...except` og `response.raise_for_status()` for at fange potentielle netværksproblemer.
Vi opretter en ThreadPoolExecutor med maksimalt 4 arbejdståde. Argumentet max_workers styrer det maksimale antal tråde, der kan bruges samtidigt. At sætte det for højt forbedrer muligvis ikke altid ydeevnen, især på I/O-bundne opgaver, hvor netværksbåndbredde ofte er flaskehalsen.
Vi bruger en listeforståelse til at sende hver URL til eksekveringen ved hjælp af executor.submit(download_page, url). Dette returnerer et Future-objekt for hver opgave.
Funktionen concurrent.futures.as_completed(futures) returnerer en iterator, der giver futures, efterhånden som de fuldføres. Dette undgår at vente på, at alle opgaver er færdige, før resultaterne behandles.
Vi itererer gennem de fuldførte futures og henter resultatet af hver opgave ved hjælp af future.result(), og summerer de samlede downloadede bytes. Fejlhåndtering inden for `download_page` sikrer, at individuelle fejl ikke nedbryder hele processen.
Til sidst udskriver vi det samlede antal downloadede bytes og den tid, det tog.

Fordele ved ThreadPoolExecutor

Forenklet samtidighed: Giver en ren og nem at bruge grænseflade til styring af tråde.
I/O-bundet ydeevne: Fremragende til opgaver, der bruger en betydelig mængde tid på at vente på I/O-operationer, såsom netværksanmodninger, fillæsninger eller databaseforespørgsler.
Reduceret overhead: Tråde har generelt lavere overhead sammenlignet med processer, hvilket gør dem mere effektive til opgaver, der involverer hyppige kontekstskift.

Begrænsninger ved ThreadPoolExecutor

GIL-begrænsning: GIL begrænser ægte parallelitet for CPU-bundne opgaver. Kun én tråd kan udføre Python-bytecode ad gangen, hvilket ophæver fordelene ved flere kerner.
Fejlfindingskompleksitet: Fejlfinding af multithreaded applikationer kan være udfordrende på grund af race conditions og andre samtidighedsrelaterede problemer.

ProcessPoolExecutor: Frigørelse af Multiprocessing for CPU-bundne opgaver

ProcessPoolExecutor overvinder GIL-begrænsningen ved at oprette en pulje af arbejdsprocesser. Hver proces har sin egen Python-interpreter og hukommelsesplads, hvilket giver mulighed for ægte parallelitet på multi-core systemer. Dette gør det ideelt til CPU-bundne opgaver, der involverer tunge beregninger.

Grundlæggende brug

Overvej en beregningstung opgave som at beregne summen af kvadrater for et stort interval af tal. Her er, hvordan du bruger ProcessPoolExecutor til at parallelisere denne opgave:


import concurrent.futures
import time
import os

def sum_of_squares(start, end):
    pid = os.getpid()
    print(f"Process ID: {pid}, Calculating sum of squares from {start} to {end}")
    total = 0
    for i in range(start, end + 1):
        total += i * i
    return total


if __name__ == "__main__": #Important for avoiding recursive spawning in some environments
    start_time = time.time()
    range_size = 1000000
    num_processes = 4
    ranges = [(i * range_size + 1, (i + 1) * range_size) for i in range(num_processes)]

    with concurrent.futures.ProcessPoolExecutor(max_workers=num_processes) as executor:
        futures = [executor.submit(sum_of_squares, start, end) for start, end in ranges]
        results = [future.result() for future in concurrent.futures.as_completed(futures)]

    total_sum = sum(results)
    print(f"Total sum of squares: {total_sum}")
    print(f"Time taken: {time.time() - start_time:.2f} seconds")

Forklaring:

Vi definerer en funktion sum_of_squares, der beregner summen af kvadrater for et givet interval af tal. Vi inkluderer `os.getpid()` for at se, hvilken proces der udfører hvert område.
Vi definerer intervalstørrelsen og antallet af processer, der skal bruges. Listen ranges oprettes for at opdele det samlede beregningsområde i mindre stykker, et for hver proces.
Vi opretter en ProcessPoolExecutor med det specificerede antal arbejdsprocesser.
Vi sender hvert interval til eksekveringen ved hjælp af executor.submit(sum_of_squares, start, end).
Vi indsamler resultaterne fra hver fremtid ved hjælp af future.result().
Vi summerer resultaterne fra alle processer for at få den endelige total.

Vigtig note: Når du bruger ProcessPoolExecutor, især på Windows, skal du omslutte koden, der opretter eksekveringen, i en if __name__ == "__main__": blok. Dette forhindrer rekursiv procesudklækning, hvilket kan føre til fejl og uventet adfærd. Dette skyldes, at modulet genimporteres i hver underordnet proces.

Fordele ved ProcessPoolExecutor

Ægte parallelitet: Overvinder GIL-begrænsningen, hvilket giver mulighed for ægte parallelitet på multi-core systemer til CPU-bundne opgaver.
Forbedret ydeevne for CPU-bundne opgaver: Betydelige ydeevneforbedringer kan opnås for beregningstunge operationer.
Robusthed: Hvis en proces går ned, nedbryder den ikke nødvendigvis hele programmet, da processer er isoleret fra hinanden.

Begrænsninger ved ProcessPoolExecutor

Højere overhead: Oprettelse og styring af processer har højere overhead sammenlignet med tråde.
Inter-Process Communication: Deling af data mellem processer kan være mere kompleks og kræver inter-process communication (IPC) mekanismer, hvilket kan tilføje overhead.
Hukommelsesforbrug: Hver proces har sin egen hukommelsesplads, hvilket kan øge applikationens samlede hukommelsesforbrug. Overførsel af store mængder data mellem processer kan blive en flaskehals.

Valg af den rigtige Executor: ThreadPoolExecutor vs. ProcessPoolExecutor

Nøglen til at vælge mellem ThreadPoolExecutor og ProcessPoolExecutor ligger i at forstå arten af dine opgaver:

I/O-bundne opgaver: Hvis dine opgaver bruger det meste af deres tid på at vente på I/O-operationer (f.eks. netværksanmodninger, fillæsninger, databaseforespørgsler), er ThreadPoolExecutor generelt det bedre valg. GIL er mindre af en flaskehals i disse scenarier, og den lavere overhead for tråde gør dem mere effektive.
CPU-bundne opgaver: Hvis dine opgaver er beregningstunge og udnytter flere kerner, er ProcessPoolExecutor vejen at gå. Det omgår GIL-begrænsningen og giver mulighed for ægte parallelitet, hvilket resulterer i betydelige ydeevneforbedringer.

Her er en tabel, der opsummerer de vigtigste forskelle:

Funktion	ThreadPoolExecutor	ProcessPoolExecutor
Samtidighedsmodel	Multithreading	Multiprocessing
GIL-påvirkning	Begrænset af GIL	Omgår GIL
Velegnet til	I/O-bundne opgaver	CPU-bundne opgaver
Overhead	Lavere	Højere
Hukommelsesforbrug	Lavere	Højere
Inter-Process Communication	Ikke påkrævet (tråde deler hukommelse)	Kræves til deling af data
Robusthed	Mindre robust (et nedbrud kan påvirke hele processen)	Mere robust (processer er isoleret)

Avancerede teknikker og overvejelser

Indsendelse af opgaver med argumenter

Begge executors giver dig mulighed for at overføre argumenter til den funktion, der udføres. Dette gøres via metoden submit():


with concurrent.futures.ThreadPoolExecutor() as executor:
    future = executor.submit(my_function, arg1, arg2)
    result = future.result()

Håndtering af undtagelser

Undtagelser, der opstår i den udførte funktion, overføres ikke automatisk til hovedtråden eller -processen. Du skal udtrykkeligt håndtere dem, når du henter resultatet af Future:


with concurrent.futures.ThreadPoolExecutor() as executor:
    future = executor.submit(my_function)
    try:
        result = future.result()
    except Exception as e:
        print(f"An exception occurred: {e}")

Brug af `map` til simple opgaver

Til simple opgaver, hvor du vil anvende den samme funktion på en række input, giver metoden map() en kortfattet måde at indsende opgaver på:


def square(x):
    return x * x


with concurrent.futures.ProcessPoolExecutor() as executor:
    numbers = [1, 2, 3, 4, 5]
    results = executor.map(square, numbers)
    print(list(results))

Styring af antallet af arbejdstagere

Argumentet max_workers i både ThreadPoolExecutor og ProcessPoolExecutor styrer det maksimale antal tråde eller processer, der kan bruges samtidigt. At vælge den rigtige værdi for max_workers er vigtigt for ydeevnen. Et godt udgangspunkt er antallet af CPU-kerner, der er tilgængelige på dit system. Men for I/O-bundne opgaver kan du drage fordel af at bruge flere tråde end kerner, da tråde kan skifte til andre opgaver, mens de venter på I/O. Eksperimentering og profilering er ofte nødvendigt for at bestemme den optimale værdi.

Overvågning af fremskridt

Modulet concurrent.futures giver ikke indbyggede mekanismer til direkte at overvåge opgavers fremskridt. Du kan dog implementere din egen fremskridtssporing ved hjælp af callbacks eller delte variabler. Biblioteker som `tqdm` kan integreres for at vise statuslinjer.

Eksempler fra den virkelige verden

Lad os overveje nogle virkelige scenarier, hvor ThreadPoolExecutor og ProcessPoolExecutor kan anvendes effektivt:

Webskrabning: Download og fortolkning af flere websider samtidigt ved hjælp af ThreadPoolExecutor. Hver tråd kan håndtere en forskellig webside, hvilket forbedrer den samlede skrabehastighed. Vær opmærksom på webstedsbrugsbetingelser og undgå at overbelaste deres servere.
Billedbehandling: Anvendelse af billedfiltre eller transformationer på et stort sæt billeder ved hjælp af ProcessPoolExecutor. Hver proces kan håndtere et forskelligt billede, hvilket udnytter flere kerner for hurtigere behandling. Overvej biblioteker som OpenCV til effektiv billedmanipulation.
Dataanalyse: Udførelse af komplekse beregninger på store datasæt ved hjælp af ProcessPoolExecutor. Hver proces kan analysere et undersæt af dataene, hvilket reducerer den samlede analysetid. Pandas og NumPy er populære biblioteker til dataanalyse i Python.
Maskinlæring: Træning af maskinlæringsmodeller ved hjælp af ProcessPoolExecutor. Nogle maskinlæringsalgoritmer kan paralleliseres effektivt, hvilket giver mulighed for hurtigere træningstider. Biblioteker som scikit-learn og TensorFlow tilbyder understøttelse af parallelisering.
Videoenkodning: Konvertering af videofiler til forskellige formater ved hjælp af ProcessPoolExecutor. Hver proces kan kode et forskelligt videosegment, hvilket gør den samlede kodningsproces hurtigere.

Globale overvejelser

Når du udvikler samtidige applikationer til et globalt publikum, er det vigtigt at overveje følgende:

Tidszoner: Vær opmærksom på tidszoner, når du håndterer tidsfølsomme operationer. Brug biblioteker som pytz til at håndtere tidszonekonverteringer.
Lokaler: Sørg for, at din applikation håndterer forskellige lokaler korrekt. Brug biblioteker som locale til at formatere tal, datoer og valutaer i henhold til brugerens lokalitet.
Tegnsæt: Brug Unicode (UTF-8) som standardtegnsættet til at understøtte en bred vifte af sprog.
Internationalisering (i18n) og lokalisering (l10n): Design din applikation, så den nemt kan internationaliseres og lokaliseres. Brug gettext eller andre oversættelsesbiblioteker til at levere oversættelser til forskellige sprog.
Netværksforsinkelse: Overvej netværksforsinkelse, når du kommunikerer med fjerntjenester. Implementer passende timeouts og fejlhåndtering for at sikre, at din applikation er modstandsdygtig over for netværksproblemer. Geografisk placering af servere kan påvirke forsinkelsen betydeligt. Overvej at bruge Content Delivery Networks (CDN'er) for at forbedre ydeevnen for brugere i forskellige regioner.

Konklusion

Modulet concurrent.futures giver en kraftfuld og bekvem måde at introducere samtidighed og parallelitet i dine Python-applikationer. Ved at forstå forskellene mellem ThreadPoolExecutor og ProcessPoolExecutor, og ved omhyggeligt at overveje arten af dine opgaver, kan du markant forbedre ydeevnen og responsiviteten af din kode. Husk at profilere din kode og eksperimentere med forskellige konfigurationer for at finde de optimale indstillinger til dit specifikke use case. Vær også opmærksom på begrænsningerne i GIL og de potentielle kompleksiteter ved multithreaded og multiprocessing programmering. Med omhyggelig planlægning og implementering kan du låse det fulde potentiale for samtidighed i Python op og skabe robuste og skalerbare applikationer til et globalt publikum.