21. srpnja 2025.Hrvatski

Istražite prikupljanje metrika uz Prometheus i Grafanu. Naučite kako učinkovito nadzirati svoje aplikacije i infrastrukturu s ovim moćnim alatima otvorenog koda.

Prikupljanje Metrika: Sveobuhvatan Vodič uz Prometheus i Grafanu

U današnjem složenom IT okruženju, učinkovito praćenje ključno je za održavanje ispravnosti i performansi aplikacija i infrastrukture. Prikupljanje metrika pruža temelj za ovo praćenje, omogućujući vam praćenje ključnih pokazatelja performansi (KPI-jeva), prepoznavanje potencijalnih problema i optimizaciju iskorištenosti resursa. Ovaj sveobuhvatan vodič istražit će kako iskoristiti Prometheus i Grafanu, dva moćna alata otvorenog koda, za robusno prikupljanje i vizualizaciju metrika.

Što je prikupljanje metrika?

Prikupljanje metrika uključuje prikupljanje numeričkih podataka koji predstavljaju stanje i ponašanje različitih sustava, aplikacija i infrastrukturnih komponenti tijekom vremena. Te metrike mogu uključivati iskorištenost CPU-a, potrošnju memorije, mrežni promet, vremena odziva, stope pogrešaka i mnoge druge relevantne pokazatelje. Analizirajući ove metrike, možete dobiti vrijedan uvid u performanse i ispravnost vašeg okruženja.

Zašto je prikupljanje metrika važno?

Proaktivna detekcija problema: Identificirajte potencijalne probleme prije nego što utječu na korisnike.
Optimizacija performansi: Precizno odredite uska grla i područja za poboljšanje.
Planiranje kapaciteta: Predvidite buduće potrebe za resursima na temelju povijesnih trendova.
Praćenje sporazuma o razini usluge (SLA): Osigurajte usklađenost s ciljevima performansi.
Rješavanje problema i analiza temeljnog uzroka: Brzo dijagnosticirajte i riješite probleme.

Predstavljanje Prometheusa i Grafane

Prometheus je otvoreni skup alata za nadzor sustava i upozoravanje izvorno razvijen u SoundCloudu. Izvrstan je u prikupljanju i pohranjivanju vremensko-serijskih podataka, odnosno podataka indeksiranih vremenskim oznakama. Prometheus koristi pull-model za prikupljanje metrika s ciljeva (npr. poslužitelja, aplikacija) u redovitim intervalima. Nudi moćan jezik za upite (PromQL) za analizu prikupljenih podataka i definiranje pravila za upozoravanje.

Grafana je otvorena platforma za vizualizaciju podataka i nadzor. Omogućuje vam stvaranje interaktivnih nadzornih ploča i grafikona za vizualizaciju podataka iz različitih izvora, uključujući Prometheus. Grafana nudi bogat skup opcija vizualizacije, uključujući grafove, dijagrame, tablice i mjerače. Također podržava upozoravanje, omogućujući vam primanje obavijesti kada su određeni pragovi prekoračeni.

Zajedno, Prometheus i Grafana čine snažno i fleksibilno rješenje za nadzor koje se može prilagoditi širokom rasponu okruženja i slučajeva upotrebe. Široko su korišteni u DevOps i SRE (Site Reliability Engineering) praksama diljem svijeta.

Prometheus Arhitektura i Koncepti

Razumijevanje ključnih komponenti Prometheusa bitno je za učinkovitu implementaciju i korištenje:

Prometheus Poslužitelj: Ključna komponenta odgovorna za prikupljanje (scraping), pohranu i upite metrika.
Otkrivanje usluga (Service Discovery): Automatski otkriva ciljeve za nadzor na temelju konfiguracije ili integracija s platformama poput Kubernetes.
Eksporteri: Agenti koji izlažu metrike u formatu koji Prometheus može razumjeti. Primjeri uključuju node_exporter (za sistemske metrike) i razne eksportere specifične za aplikacije.
Pushgateway (Opcionalno): Omogućuje kratkotrajnim poslovima da šalju metrike Prometheusu. Ovo je korisno za skupne poslove koji možda ne rade kontinuirano.
Alertmanager: Obrađuje upozorenja generirana od strane Prometheusa na temelju konfiguriranih pravila. Može usmjeravati upozorenja na različite kanale obavijesti, kao što su e-pošta, Slack ili PagerDuty.
PromQL: Prometheus jezik za upite koji se koristi za upitivanje i analizu prikupljenih metrika.

Prometheus Tok Rada

Ciljevi (aplikacije, poslužitelji itd.) izlažu metrike. Ove metrike se obično izlažu putem HTTP krajnje točke.
Prometheus poslužitelj prikuplja metrike s konfiguriranih ciljeva. Periodično povlači metrike s ovih krajnjih točaka.
Prometheus pohranjuje prikupljene metrike u svoju vremensko-serijsku bazu podataka.
Korisnici upituju metrike koristeći PromQL. To im omogućuje analizu podataka i stvaranje grafova i nadzornih ploča.
Pravila upozorenja se procjenjuju na temelju pohranjenih metrika. Ako je uvjet pravila ispunjen, pokreće se upozorenje.
Alertmanager obrađuje pokrenuta upozorenja. Uklanja duplikate, grupira ih i prosljeđuje odgovarajućim kanalima za obavijesti.

Grafana Arhitektura i Koncepti

Grafana nadopunjuje Prometheus pružajući korisnički prilagođeno sučelje za vizualizaciju i analizu prikupljenih metrika:

Izvori podataka: Veze na različite izvore podataka, uključujući Prometheus, Graphite, InfluxDB i druge.
Nadzorne ploče: Zbirke panela koji prikazuju podatke u različitim formatima (grafovi, dijagrami, tablice itd.).
Paneli: Pojedinačne vizualizacije koje prikazuju podatke iz određenog izvora podataka koristeći određeni upit.
Upozoravanje: Grafana također ima ugrađene mogućnosti upozoravanja, omogućujući vam definiranje upozorenja na temelju podataka prikazanih na vašim nadzornim pločama. Ova upozorenja mogu koristiti Prometheus kao izvor podataka i iskoristiti PromQL za složenu logiku upozoravanja.
Organizacije i timovi: Grafana podržava organizacije i timove, omogućujući vam upravljanje pristupom i dopuštenjima za nadzorne ploče i izvore podataka.

Grafana Tok Rada

Konfigurirajte izvore podataka: Povežite Grafanu sa svojim Prometheus poslužiteljem.
Stvorite nadzorne ploče: Dizajnirajte nadzorne ploče za vizualizaciju svojih metrika.
Dodajte panele na nadzorne ploče: Dodajte panele za prikaz određenih podatkovnih točaka iz Prometheusa koristeći PromQL upite.
Konfigurirajte upozoravanje (opcionalno): Postavite pravila upozoravanja unutar Grafane za primanje obavijesti na temelju određenih pragova metrika.
Podijelite nadzorne ploče: Podijelite nadzorne ploče sa svojim timom za suradnju na nadzoru i analizi.

Postavljanje Prometheusa i Grafane

Ovaj odjeljak pruža vodič korak po korak za postavljanje Prometheusa i Grafane.

Instalacija Prometheusa

1. Preuzmite Prometheus:

Preuzmite najnoviju verziju Prometheusa sa službene web stranice: https://prometheus.io/download/. Odaberite odgovarajući paket za svoj operativni sustav (npr. Linux, Windows, macOS).

2. Raspakirajte Arhivu:

Raspakirajte preuzetu arhivu u direktorij po vašem izboru.

3. Konfigurirajte Prometheus:

Stvorite konfiguracijsku datoteku `prometheus.yml`. Ova datoteka definira ciljeve koje će Prometheus prikupljati i druge opcije konfiguracije. Osnovna konfiguracija mogla bi izgledati ovako:


global:
  scrape_interval:     15s
  evaluation_interval: 15s

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']

  - job_name: 'node_exporter'
    static_configs:
      - targets: ['localhost:9100']

Ova konfiguracija definira dva posla prikupljanja: jedan za sam Prometheus (prikupljanje vlastitih metrika) i jedan za node_exporter koji radi na localhost portu 9100. `scrape_interval` određuje koliko često će Prometheus prikupljati ciljeve.

4. Pokrenite Prometheus:

Pokrenite izvršnu datoteku Prometheusa iz direktorija u koji ste raspakirali arhivu:

            ./prometheus --config.file=prometheus.yml

Prometheus će se pokrenuti i prema zadanim postavkama slušati na portu 9090. Prometheus web sučelju možete pristupiti u svom pregledniku na http://localhost:9090.

Instalacija Grafane

1. Preuzmite Grafanu:

Preuzmite najnoviju verziju Grafane sa službene web stranice: https://grafana.com/grafana/download. Odaberite odgovarajući paket za svoj operativni sustav.

2. Instalirajte Grafanu:

Slijedite upute za instalaciju za svoj operativni sustav. Na primjer, na Debianu/Ubuntu:

            
sudo apt-get update
sudo apt-get install -y apt-transport-https
sudo apt-get install -y software-properties-common wget
wget -q -O - https://packages.grafana.com/gpg.key | sudo apt-key add -
echo "deb https://packages.grafana.com/oss/deb stable main" | sudo tee -a /etc/apt/sources.list.d/grafana.list
sudo apt-get update
sudo apt-get install grafana

3. Pokrenite Grafanu:

Pokrenite uslugu Grafana:

            sudo systemctl start grafana-server

4. Pristupite Grafani:

Grafana će se pokrenuti i prema zadanim postavkama slušati na portu 3000. Grafana web sučelju možete pristupiti u svom pregledniku na http://localhost:3000.

Zadano korisničko ime i lozinka su `admin` i `admin`. Bit ćete zatraženi da promijenite lozinku pri prvoj prijavi.

Povezivanje Grafane s Prometheusom

Za vizualizaciju metrika iz Prometheusa u Grafani, morate konfigurirati Prometheus kao izvor podataka u Grafani.

1. Dodajte izvor podataka:

U Grafana web sučelju, idite na Configuration > Data Sources i kliknite Add data source.

2. Odaberite Prometheus:

Odaberite Prometheus kao vrstu izvora podataka.

3. Konfigurirajte Prometheus Vezu:

Unesite URL vašeg Prometheus poslužitelja (npr. `http://localhost:9090`). Konfigurirajte druge opcije po potrebi (npr. autentifikaciju).

4. Spremi i Testiraj:

Kliknite Save & Test kako biste provjerili može li se Grafana uspješno povezati s Prometheusom.

Stvaranje nadzornih ploča u Grafani

Nakon što ste povezali Grafanu s Prometheusom, možete stvarati nadzorne ploče za vizualizaciju svojih metrika.

1. Stvorite novu nadzornu ploču:

U Grafana web sučelju, kliknite ikonu + u bočnoj traci i odaberite Dashboard.

2. Dodajte panel:

Kliknite Add an empty panel za dodavanje novog panela na nadzornu ploču.

3. Konfigurirajte Panel:

Odaberite izvor podataka: Odaberite Prometheus izvor podataka koji ste ranije konfigurirali.
Unesite PromQL upit: Unesite PromQL upit za dohvaćanje metrike koju želite vizualizirati. Na primjer, za prikaz iskorištenosti CPU-a, mogli biste koristiti sljedeći upit:

            
rate(process_cpu_seconds_total{job="node_exporter"}[5m])

This query calculates the rate of change of CPU time used by processes collected by the node_exporter over a 5-minute interval.

Konfigurirajte opcije vizualizacije: Odaberite vrstu vizualizacije (npr. grafikon, mjerač, tablica) i konfigurirajte druge opcije po potrebi (npr. oznake osi, boje).

4. Spremite nadzornu ploču:

Kliknite ikonu za spremanje kako biste spremili nadzornu ploču.

PromQL: Jezik za upite Prometheusa

PromQL je moćan jezik za upite koji se koristi za dohvaćanje i manipulaciju metrikama pohranjenim u Prometheusu. Omogućuje vam izvođenje širokog raspona operacija, uključujući:

Filtriranje: Odaberite metrike na temelju oznaka.
Agregacija: Izračunajte agregirane vrijednosti (npr. zbroj, prosjek, maksimum) tijekom vremenskih raspona ili preko više instanci.
Izračun stope: Izračunajte stopu promjene brojača metrika.
Aritmetičke operacije: Izvršite aritmetičke operacije na metrikama (npr. zbrajanje, oduzimanje, množenje).
Funkcije vremenskih serija: Primijenite funkcije na podatke vremenskih serija (npr. klizni prosjek, izglađivanje).

PromQL Primjeri

Iskorištenost CPU-a:

            
rate(process_cpu_seconds_total{job="node_exporter"}[5m])

Korištenje memorije:

            
node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes

Iskorištenost diskovnog prostora:

            
(node_filesystem_size_bytes{mountpoint="/"} - node_filesystem_free_bytes{mountpoint="/"}) / node_filesystem_size_bytes{mountpoint="/"} * 100

Stopa HTTP zahtjeva:

            
rate(http_requests_total[5m])

Učenje PromQL-a ključno je za učinkovito korištenje Prometheusa i Grafane. Za sveobuhvatan vodič kroz jezik pogledajte Prometheus dokumentaciju.

Upozoravanje uz Prometheus i Alertmanager

Prometheus pruža robustan sustav upozoravanja koji vam omogućuje definiranje pravila na temelju vrijednosti metrika. Kada je uvjet pravila ispunjen, pokreće se upozorenje, a Alertmanager obrađuje proces obavješćivanja.

Definiranje pravila za upozoravanje

Pravila za upozoravanje definirana su u konfiguracijskoj datoteci `prometheus.yml`. Evo primjera pravila za upozoravanje koje se aktivira kada iskorištenost CPU-a prijeđe 80%:

            
rule_files:
  - "rules.yml"

Zatim, u datoteku nazvanu `rules.yml`, postavite pravila poput ovog:


groups:
- name: example
  rules:
  - alert: HighCPUUsage
    expr: rate(process_cpu_seconds_total{job="node_exporter"}[5m]) > 0.8
    for: 1m
    labels:
      severity: critical
    annotations:
      summary: "High CPU usage detected"
      description: "CPU usage is above 80% on {{ $labels.instance }}"

Objašnjenje:

alert: Naziv upozorenja.
expr: PromQL izraz koji definira uvjet upozorenja.
for: Trajanje tijekom kojeg uvjet mora biti istinit prije nego što se upozorenje pokrene.
labels: Oznake koje su priložene upozorenju.
annotations: Bilješke koje pružaju dodatne informacije o upozorenju, kao što su sažetak i opis.

Konfiguriranje Alertmanagera

Alertmanager obrađuje usmjeravanje i obavješćivanje o upozorenjima. Morate konfigurirati Alertmanager kako biste odredili gdje bi se upozorenja trebala slati (npr. e-pošta, Slack, PagerDuty). Za detaljne upute za konfiguraciju pogledajte dokumentaciju Alertmanagera.

Minimalna `alertmanager.yml` konfiguracija mogla bi izgledati ovako:


global:
  resolve_timeout: 5m

route:
  group_by: ['alertname']
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 12h
  receiver: 'web.hook'

receivers:
- name: 'web.hook'
  webhook_configs:
  - url: 'http://localhost:8080/'

Ova konfiguracija šalje upozorenja web-hooku na localhost portu 8080. Možete prilagoditi odjeljak `receivers` za korištenje usluga poput Slacka ili e-pošte umjesto toga.

Praktični primjeri i slučajevi upotrebe

Prometheus i Grafana mogu se koristiti za nadzor širokog raspona aplikacija i infrastrukturnih komponenti. Evo nekoliko praktičnih primjera:

Nadzor web poslužitelja: Pratite stope HTTP zahtjeva, vremena odziva i stope pogrešaka kako biste osigurali optimalne performanse web poslužitelja.
Nadzor baze podataka: Pratite korištenje skupa veza baze podataka, vremena izvršavanja upita i spore upite kako biste identificirali uska grla baze podataka.
Nadzor Kubernetes: Pratite ispravnost i performanse Kubernetes klastera, uključujući iskorištenost resursa podova i čvorova.
Nadzor aplikacija: Prikupljajte prilagođene metrike iz svojih aplikacija za praćenje specifičnih poslovnih KPI-jeva i identificiranje problema na razini aplikacije.
Nadzor mreže: Pratite mrežni promet, latenciju i gubitak paketa kako biste identificirali uska grla mreže i probleme s performansama.
Nadzor cloud infrastrukture: Pratite performanse i dostupnost cloud resursa, poput virtualnih strojeva, pohrane i baza podataka. Ovo je posebno relevantno za AWS, Azure i Google Cloud okruženja, koja sva imaju integracije s Prometheusom i Grafanom.

Primjer: Nadzor arhitekture mikrousluga

U arhitekturi mikrousluga, Prometheus i Grafana mogu se koristiti za nadzor ispravnosti i performansi pojedinačnih usluga, kao i cjelokupnog sustava. Svaka usluga može izložiti vlastite metrike, poput stopa zahtjeva, vremena odziva i stopa pogrešaka. Prometheus tada može prikupljati (scrape) ove metrike, a Grafana se može koristiti za njihovu vizualizaciju. To vam omogućuje brzo prepoznavanje uskih grla performansi ili kvarova u specifičnim uslugama.

Napredne tehnike i najbolje prakse

Kako biste maksimalno iskoristili Prometheus i Grafanu, razmotrite sljedeće napredne tehnike i najbolje prakse:

Koristite smislene oznake: Koristite oznake kako biste dodali kontekst svojim metrikama. To olakšava filtriranje i agregiranje podataka. Na primjer, koristite oznake za identifikaciju usluge, okruženja i instance s kojom je metrika povezana.
Nadzirite ključne pokazatelje performansi (KPI): Usredotočite se na nadzor metrika koje su najkritičnije za vaše poslovanje. To vam omogućuje brzo identificiranje i rješavanje problema koji imaju najveći utjecaj.
Postavite odgovarajuće pragove upozoravanja: Postavite pragove upozoravanja koji su prikladni za vaše okruženje. Izbjegavajte postavljanje preosjetljivih pragova, jer to može dovesti do zamora upozorenjima.
Učinkovito koristite nadzorne ploče: Dizajnirajte nadzorne ploče koje su lako razumljive i pružaju praktične uvide. Koristite jasne i sažete oznake i vizualizacije.
Automatizirajte implementaciju i konfiguraciju: Automatizirajte implementaciju i konfiguraciju Prometheusa i Grafane pomoću alata poput Ansible, Terraform ili Kubernetes.
Osigurajte svoje Prometheus i Grafana instance: Osigurajte svoje Prometheus i Grafana instance kako biste spriječili neovlašten pristup. Koristite autentifikaciju i autorizaciju za kontrolu pristupa osjetljivim podacima.
Razmotrite horizontalno skaliranje: Za velika okruženja, razmislite o horizontalnom skaliranju svojih Prometheus i Grafana instanci kako biste podnijeli povećano opterećenje. To se može postići korištenjem više Prometheus poslužitelja i Grafana instanci iza balansera opterećenja.
Iskoristite otkrivanje usluga: Iskoristite Prometheusove mogućnosti otkrivanja usluga za automatsko otkrivanje i nadzor novih ciljeva. Ovo je posebno korisno u dinamičnim okruženjima poput Kubernetes.

Rješavanje uobičajenih problema

Čak i uz pažljivo planiranje i implementaciju, možete naići na probleme prilikom korištenja Prometheusa i Grafane. Evo nekih uobičajenih problema i njihovih rješenja:

Prometheus ne prikuplja metrike: Provjerite je li cilj dostupan s Prometheus poslužitelja. Provjerite Prometheus logove za pogreške. Osigurajte da cilj izlaže metrike u ispravnom formatu.
Grafana se ne povezuje s Prometheusom: Provjerite je li Prometheus URL ispravan u konfiguraciji izvora podataka Grafane. Provjerite Grafana logove za pogreške. Osigurajte da Prometheus poslužitelj radi i da je dostupan s Grafana poslužitelja.
PromQL upiti ne vraćaju podatke: Provjerite je li PromQL upit ispravan. Provjerite Prometheus logove za pogreške. Osigurajte da metrika koju upitujete postoji i da je prikuplja Prometheus.
Upozorenja se ne pokreću: Provjerite je li pravilo upozorenja ispravno definirano. Provjerite Prometheus logove za pogreške. Osigurajte da Alertmanager radi i da je ispravno konfiguriran.
Problemi s performansama: Ako imate problema s performansama, razmislite o horizontalnom skaliranju svojih Prometheus i Grafana instanci. Optimizirajte svoje PromQL upite kako biste smanjili opterećenje Prometheus poslužitelja.

Alternativna rješenja za nadzor

Iako su Prometheus i Grafana moćni alati, oni nisu jedine opcije za prikupljanje i vizualizaciju metrika. Ostala popularna rješenja za nadzor uključuju:

Datadog: Komercijalna platforma za nadzor koja nudi širok raspon značajki, uključujući prikupljanje metrika, upravljanje logovima i nadzor performansi aplikacija (APM).
New Relic: Još jedna komercijalna platforma za nadzor koja pruža sveobuhvatne mogućnosti nadzora za aplikacije i infrastrukturu.
InfluxDB i Chronograf: Baza podataka vremenskih serija i platforma za vizualizaciju koja se često koristi kao alternativa Prometheusu i Grafani.
Elasticsearch, Logstash i Kibana (ELK Stack): Popularni skup alata otvorenog koda za upravljanje i analizu logova. Iako se prvenstveno koristi za logove, može se koristiti i za prikupljanje i vizualizaciju metrika.
Dynatrace: Platforma za nadzor pokretana umjetnom inteligencijom koja pruža cjelovitu vidljivost performansi aplikacija i infrastrukture.

Najbolje rješenje za nadzor za vašu organizaciju ovisit će o vašim specifičnim zahtjevima i budžetu.

Zaključak

Prikupljanje metrika ključno je za održavanje ispravnosti i performansi aplikacija i infrastrukture. Prometheus i Grafana pružaju snažno i fleksibilno rješenje otvorenog koda za prikupljanje, pohranu i vizualizaciju metrika. Razumijevanjem temeljnih koncepata i slijedeći najbolje prakse navedene u ovom vodiču, možete iskoristiti Prometheus i Grafanu za izgradnju robusnog sustava nadzora koji zadovoljava potrebe vaše organizacije.

Učinkovito praćenje, u kombinaciji s proaktivnim upozoravanjem i brzim odgovorom na incidente, temelj je modernih IT operacija. Prihvaćanje alata poput Prometheusa i Grafane omogućuje organizacijama da isporučuju pouzdane i učinkovite usluge svojim korisnicima, bez obzira na njihovu lokaciju ili industriju.