DevOps edukacija i certifikacija

DevOps

DevOps je skup kulturalnih načela, praksi i alata koji spajaju razvoj (Dev) i operacije (Ops) kako bi se ubrzala isporuka i podigla kvaliteta i pouzdanost softverskih usluga. DevOps uklanja “silose”, potiče zajedničku odgovornost za rezultat i pretvara ideje u vrijednost brže, sigurnije i predvidljivije.

Osnovna DevOps ideja: Umjesto prebacivanja zadataka između timova, DevOps uvodi stalnu suradnju, automatizaciju i mjerenje kroz cijeli životni ciklus: od planiranja i razvoja, preko testiranja i isporuke, do nadzora i povratnih informacija – u kontinuirnoj petlji.

  • Culture (kultura) – povjerenje, zajednički ciljevi, blameless učenje.
  • Automation (automatizacija) – CI/CD, IaC i ponovljive pipelineove.
  • Measurement (mjerenje) – metrike toka, kvalitete i pouzdanosti.
  • Sharing (dijeljenje) – vidljivost, runbookovi, zajedničke prakse i alati.
  • CI/CD: kontinuirana integracija i isporuka s automatiziranim build/test/release koracima.
  • Infrastructure as Code (IaC): deklarativna, verzionirana infrastruktura.
  • Automatizirano testiranje: unit, integracijski, e2e, sigurnosni testovi.
  • Release & deployment strategije: blue/green, canary, feature flagovi.
  • Observability i feedback: metrike, logovi, tracing, korisničke povratne informacije.
  • Security by design (DevSecOps): skeniranje ovisnosti, SAST/DAST, tajne, “shift-left” sigurnost.
  • Incident & problem management: standardizirani odgovor i postmortemi s fokusom na učenje.
  • Product + Dev + Ops rade kao jedan tim: dijele ciljeve, planove i KPI-je.
  • Platform/DevOps inženjeri: grade platforme, pipelineove i alate koji ubrzavaju timove.
  • Voditelji: uklanjaju prepreke, potiču kulturu eksperimentiranja i mjere ishod, ne aktivnost.
  • Deployment frequency – koliko često isporučujemo.
  • Lead time for changes – vrijeme od commit-a do produkcije.
  • Change fail rate – udio releasa koji uzrokuju incidente.
  • MTTR (mean time to recovery) – brzina oporavka nakon problema.
  • Kvaliteta – pokrivenost testovima, defekti po releasu, sigurnosni nalazi.
  • CI/CD: GitHub/GitLab CI, Jenkins, CircleCI
  • IaC: Terraform, Ansible, Helm, Pulumi
  • Container/Orkestracija: Docker, Kubernetes, ArgoCD/Flux
  • Observability: Prometheus, Grafana, ELK/Loki, OpenTelemetry
  • Sigurnost: Trivy/Grype, Snyk, OPA, Vault
    (DevOps je prije svega o praksi i kulturi – alati su “enableri”.)

Your Content Goes Here

  • DevOps je krovni pristup suradnji i ubrzavanju toka promjena.
  • SRE operacionalizira pouzdanost unutar DevOps svijeta kroz SLO/error budget i inženjerske prakse.
  • U ITSM okruženju DevOps modernizira Incident/Change/Problem procese: manje čekanja, više automatizacije i mjerljivih ishoda.
  • Brža isporuka značajki uz manje rizika.
  • Stabilnija produkcija i brži oporavak.
  • Transparentnost i bolja suradnja među timovima.
  • Niži troškovi kroz automatizaciju i eliminaciju ručnog rada.
  • Veća motivacija i vlasništvo nad proizvodom.
  • Silosna organizacija → zajednički KPI-jevi i cross-funkcionalni timovi.
  • Previše alata, premalo standarda → platform engineering i “paved roads”.
  • Sigurnost kao “gate” → DevSecOps i rani sigurnosni testovi u pipelineu.
  • Alert fatigue i nepreglednost → standardizirani dashboardi, SLO-ovi i runbookovi.
  1. Mapirajte tok promjena i mjerite DORA metrike kao polaznu točku.
  2. Uvedite CI (svaki commit gradi i testira) i mali batch releasa.
  3. Standardizirajte deploy (automatizirani, ponovljiv, auditabilan).
  4. Primijenite IaC na barem jedan okruženjski sloj.
  5. Osigurajte observability i runbookove za ključne tokove.
  6. Uvedite retrospektive i blameless kulturu – stalno učenje je temelj.

Sažetak: DevOps omogućuje organizacijama da isporučuju brže i pouzdanije, spajajući ljude, procese i tehnologiju u jedan tok vrijednosti. Kroz kulturu suradnje, automatizaciju i mjerljive ciljeve, DevOps skraćuje vrijeme do vrijednosti – uz bolju kvalitetu i manji operativni rizik.

Site Reliability Engineering (SRE)

Site Reliability Engineering (SRE) je pristup vođen inženjerstvom koji primjenjuje softverske principe na operacije kako bi digitalne usluge bile dostupne, brze i sigurne. Nastao je u Googleu početkom 2000-ih, a danas je standard u tvrtkama koje žele mjerljiviju pouzdanost i bržu isporuku promjena.

Osnovna SRE Ideja: Umjesto reaktivnog “gašenja požara”, SRE definira ciljeve razine usluge (SLO) koji odražavaju stvarno korisničko iskustvo, prati indikatore (SLI), postavlja budžet pogrešaka (error budget) i optimizira rad kroz automatizaciju, observability i kulturu učenja.

  • SLI (Service Level Indicator) – mjerljiva metrika usluge (npr. dostupnost, latencija p99, stopa grešaka).
  • SLO (Service Level Objective) – ciljna vrijednost SLI-ja (npr. dostupnost 99,9% mjesečno).
  • Error budget – dopuštena količina “nepouzdanosti” (npr. 0,1% nedostupnosti), kojom se upravlja tempom releasanja i prioritetima.
  • Toil – ponavljajući, manualni operativni rad koji se može automatizirati.
  • Blameless postmortem – analiza incidenta bez okrivljavanja, s konkretnim akcijama poboljšanja.
  • Upravljanje SLO/SLI: dizajn metrika po usluzi, kontinuirano praćenje i periodični review.
  • Observability: objedinjene metrike, logovi i tracing; jasni “golden signals” (latencija, promet, greške, zasićenje).
  • Incident management: detekcija, eskalacija, vođenje incidenta, komunikacija, postmortemi.
  • Automatizacija i smanjenje toila: CI/CD, Infrastructure as Code, runbookovi, auto-remediation.
  • Kapacitet, performanse i otpornost: testovi opterećenja, chaos engineering, degradirani načini rada
  • SRE inženjer: razvoj alata i automatizacije, dizajn SLO-ova, vođenje incidenata, smanjenje toila.
  • Product/Engineering timovi: usklađivanje značajki s error budgetom, kvalitetom i observabilityjem.
  • Voditelji/menadžeri: donošenje odluka temeljenih na SLO-ovima, balansiranje brzine i rizika.
  • Dostupnost (%) po regiji/usluzi
  • Latencija (p50/p90/p99) i timeouts
  • Stopa grešaka (4xx/5xx, gubici poruka)
  • MTTA/MTTR (vrijeme do reakcije/opravka)
  • Incident rate i ozbiljnost (sev)
  • Toil % i deployment frequency / change fail rate
  • Observability: Prometheus/Grafana, OpenTelemetry, Loki/ELK, Jaeger/Tempo
  • Incidenti/on-call: PagerDuty/Opsgenie
  • Automatizacija: GitHub/GitLab CI, ArgoCD/Flux, Terraform/Ansible
  • Cloud/Platforma: Kubernetes, AWS/Azure/GCP
  • DevOps naglašava kulturu i suradnju; SRE to operacionalizira kroz SLO-ove, proračun pogrešaka i inženjerske prakse.
  • U ITSM okruženju SRE ubrzava Incident/Problem/Change procese i povezuje SLO ↔ SLA.
  • Veća predvidljivost i manje prekida
  • Brži oporavak (niži MTTR) i kvalitetniji releasi
  • Transparentnost kroz jasne metrike i ciljeve
  • Niži operativni trošak kroz automatizaciju i manje toila
  • Kulturološka promjena → blameless pristup i jasna komunikacija.
  • Metrike “za sebe” → SLO-ovi moraju odražavati korisničko iskustvo, ne samo tehničke signale.
  • Previše alarma → tuning pragova, agregacija, runbookovi i paging higijena.
  • Otpor automatizaciji → mjeriti i prikazivati uštede (vrijeme, incidenti).
  1. Identificirajte kritične korisničke tokove i definirajte 3–5 SLI-jeva.
  2. Postavite SLO ciljeve i error budget politiku.
  3. Standardizirajte incident response i uvedite blameless postmorteme.
  4. Mapirajte i smanjite toil (brze automatizacije).
  5. Uvedite operativni ritam: mjesečni SLO review i plan poboljšanja.

Sažetak: SRE omogućuje da pouzdanost bude namjeran, mjerljiv ishod, a ne slučajnost. Kroz SLO-ove, observability, incident management i automatizaciju, timovi postižu stabilnost bez usporavanja razvoja – upravo suprotno, ubrzavaju isporuku uz kontrolirani rizik.