DevOps edukacija i certifikacija

DevOps

DevOps je skup kulturalnih načela, praksi i alata koji spajaju razvoj (Dev) i operacije (Ops) kako bi se ubrzala isporuka i podigla kvaliteta i pouzdanost softverskih usluga. DevOps uklanja “silose”, potiče zajedničku odgovornost za rezultat i pretvara ideje u vrijednost brže, sigurnije i predvidljivije.

Osnovna DevOps ideja: Umjesto prebacivanja zadataka između timova, DevOps uvodi stalnu suradnju, automatizaciju i mjerenje kroz cijeli životni ciklus: od planiranja i razvoja, preko testiranja i isporuke, do nadzora i povratnih informacija – u kontinuirnoj petlji.

Ključni principi (CAMS)

Culture (kultura) – povjerenje, zajednički ciljevi, blameless učenje.
Automation (automatizacija) – CI/CD, IaC i ponovljive pipelineove.
Measurement (mjerenje) – metrike toka, kvalitete i pouzdanosti.
Sharing (dijeljenje) – vidljivost, runbookovi, zajedničke prakse i alati.

Prakse i procesi u DevOpsu

CI/CD: kontinuirana integracija i isporuka s automatiziranim build/test/release koracima.
Infrastructure as Code (IaC): deklarativna, verzionirana infrastruktura.
Automatizirano testiranje: unit, integracijski, e2e, sigurnosni testovi.
Release & deployment strategije: blue/green, canary, feature flagovi.
Observability i feedback: metrike, logovi, tracing, korisničke povratne informacije.
Security by design (DevSecOps): skeniranje ovisnosti, SAST/DAST, tajne, “shift-left” sigurnost.
Incident & problem management: standardizirani odgovor i postmortemi s fokusom na učenje.

Uloge i odgovornosti

Product + Dev + Ops rade kao jedan tim: dijele ciljeve, planove i KPI-je.
Platform/DevOps inženjeri: grade platforme, pipelineove i alate koji ubrzavaju timove.
Voditelji: uklanjaju prepreke, potiču kulturu eksperimentiranja i mjere ishod, ne aktivnost.

Tipične metrike (DORA + kvaliteta)

Deployment frequency – koliko često isporučujemo.
Lead time for changes – vrijeme od commit-a do produkcije.
Change fail rate – udio releasa koji uzrokuju incidente.
MTTR (mean time to recovery) – brzina oporavka nakon problema.
Kvaliteta – pokrivenost testovima, defekti po releasu, sigurnosni nalazi.

Alati (primjeri)

CI/CD: GitHub/GitLab CI, Jenkins, CircleCI
IaC: Terraform, Ansible, Helm, Pulumi
Container/Orkestracija: Docker, Kubernetes, ArgoCD/Flux
Observability: Prometheus, Grafana, ELK/Loki, OpenTelemetry
Sigurnost: Trivy/Grype, Snyk, OPA, Vault
(DevOps je prije svega o praksi i kulturi – alati su “enableri”.)

Your Content Goes Here

Odnos s SRE-om i ITSM-om

DevOps je krovni pristup suradnji i ubrzavanju toka promjena.
SRE operacionalizira pouzdanost unutar DevOps svijeta kroz SLO/error budget i inženjerske prakse.
U ITSM okruženju DevOps modernizira Incident/Change/Problem procese: manje čekanja, više automatizacije i mjerljivih ishoda.

Prednosti za organizaciju

Brža isporuka značajki uz manje rizika.
Stabilnija produkcija i brži oporavak.
Transparentnost i bolja suradnja među timovima.
Niži troškovi kroz automatizaciju i eliminaciju ručnog rada.
Veća motivacija i vlasništvo nad proizvodom.

Izazovi i kako ih adresirati

Silosna organizacija → zajednički KPI-jevi i cross-funkcionalni timovi.
Previše alata, premalo standarda → platform engineering i “paved roads”.
Sigurnost kao “gate” → DevSecOps i rani sigurnosni testovi u pipelineu.
Alert fatigue i nepreglednost → standardizirani dashboardi, SLO-ovi i runbookovi.

Kako početi (minimalni koraci)

Mapirajte tok promjena i mjerite DORA metrike kao polaznu točku.
Uvedite CI (svaki commit gradi i testira) i mali batch releasa.
Standardizirajte deploy (automatizirani, ponovljiv, auditabilan).
Primijenite IaC na barem jedan okruženjski sloj.
Osigurajte observability i runbookove za ključne tokove.
Uvedite retrospektive i blameless kulturu – stalno učenje je temelj.

Sažetak: DevOps omogućuje organizacijama da isporučuju brže i pouzdanije, spajajući ljude, procese i tehnologiju u jedan tok vrijednosti. Kroz kulturu suradnje, automatizaciju i mjerljive ciljeve, DevOps skraćuje vrijeme do vrijednosti – uz bolju kvalitetu i manji operativni rizik.

Site Reliability Engineering (SRE)

Site Reliability Engineering (SRE) je pristup vođen inženjerstvom koji primjenjuje softverske principe na operacije kako bi digitalne usluge bile dostupne, brze i sigurne. Nastao je u Googleu početkom 2000-ih, a danas je standard u tvrtkama koje žele mjerljiviju pouzdanost i bržu isporuku promjena.

Osnovna SRE Ideja: Umjesto reaktivnog “gašenja požara”, SRE definira ciljeve razine usluge (SLO) koji odražavaju stvarno korisničko iskustvo, prati indikatore (SLI), postavlja budžet pogrešaka (error budget) i optimizira rad kroz automatizaciju, observability i kulturu učenja.

Ključni pojmovi

SLI (Service Level Indicator) – mjerljiva metrika usluge (npr. dostupnost, latencija p99, stopa grešaka).
SLO (Service Level Objective) – ciljna vrijednost SLI-ja (npr. dostupnost 99,9% mjesečno).
Error budget – dopuštena količina “nepouzdanosti” (npr. 0,1% nedostupnosti), kojom se upravlja tempom releasanja i prioritetima.
Toil – ponavljajući, manualni operativni rad koji se može automatizirati.
Blameless postmortem – analiza incidenta bez okrivljavanja, s konkretnim akcijama poboljšanja.

Prakse i procesi u SRE-u

Upravljanje SLO/SLI: dizajn metrika po usluzi, kontinuirano praćenje i periodični review.
Observability: objedinjene metrike, logovi i tracing; jasni “golden signals” (latencija, promet, greške, zasićenje).
Incident management: detekcija, eskalacija, vođenje incidenta, komunikacija, postmortemi.
Automatizacija i smanjenje toila: CI/CD, Infrastructure as Code, runbookovi, auto-remediation.
Kapacitet, performanse i otpornost: testovi opterećenja, chaos engineering, degradirani načini rada

Uloge i odgovornosti

SRE inženjer: razvoj alata i automatizacije, dizajn SLO-ova, vođenje incidenata, smanjenje toila.
Product/Engineering timovi: usklađivanje značajki s error budgetom, kvalitetom i observabilityjem.
Voditelji/menadžeri: donošenje odluka temeljenih na SLO-ovima, balansiranje brzine i rizika.

Tipične metrike

Dostupnost (%) po regiji/usluzi
Latencija (p50/p90/p99) i timeouts
Stopa grešaka (4xx/5xx, gubici poruka)
MTTA/MTTR (vrijeme do reakcije/opravka)
Incident rate i ozbiljnost (sev)
Toil % i deployment frequency / change fail rate

Alati (primjeri)

Observability: Prometheus/Grafana, OpenTelemetry, Loki/ELK, Jaeger/Tempo
Incidenti/on-call: PagerDuty/Opsgenie
Automatizacija: GitHub/GitLab CI, ArgoCD/Flux, Terraform/Ansible
Cloud/Platforma: Kubernetes, AWS/Azure/GCP

Odnos s DevOps-om i ITSM-om

DevOps naglašava kulturu i suradnju; SRE to operacionalizira kroz SLO-ove, proračun pogrešaka i inženjerske prakse.
U ITSM okruženju SRE ubrzava Incident/Problem/Change procese i povezuje SLO ↔ SLA.

Prednosti za organizaciju

Veća predvidljivost i manje prekida
Brži oporavak (niži MTTR) i kvalitetniji releasi
Transparentnost kroz jasne metrike i ciljeve
Niži operativni trošak kroz automatizaciju i manje toila

Izazovi i kako ih adresirati

Kulturološka promjena → blameless pristup i jasna komunikacija.
Metrike “za sebe” → SLO-ovi moraju odražavati korisničko iskustvo, ne samo tehničke signale.
Previše alarma → tuning pragova, agregacija, runbookovi i paging higijena.
Otpor automatizaciji → mjeriti i prikazivati uštede (vrijeme, incidenti).

Kako početi (minimalni koraci)

Identificirajte kritične korisničke tokove i definirajte 3–5 SLI-jeva.
Postavite SLO ciljeve i error budget politiku.
Standardizirajte incident response i uvedite blameless postmorteme.
Mapirajte i smanjite toil (brze automatizacije).
Uvedite operativni ritam: mjesečni SLO review i plan poboljšanja.

Sažetak: SRE omogućuje da pouzdanost bude namjeran, mjerljiv ishod, a ne slučajnost. Kroz SLO-ove, observability, incident management i automatizaciju, timovi postižu stabilnost bez usporavanja razvoja – upravo suprotno, ubrzavaju isporuku uz kontrolirani rizik.

DEVOPS & SITE RELIABILITY ENGINEERING (SRE)

E-learning

DevOps edukacija i certifikacija

DevOps

Ključni principi (CAMS)

Prakse i procesi u DevOpsu

Uloge i odgovornosti

Tipične metrike (DORA + kvaliteta)

Alati (primjeri)

Odnos s SRE-om i ITSM-om

Prednosti za organizaciju

Izazovi i kako ih adresirati

Kako početi (minimalni koraci)

Site Reliability Engineering (SRE)

Ključni pojmovi

Prakse i procesi u SRE-u

Uloge i odgovornosti

Tipične metrike

Alati (primjeri)

Odnos s DevOps-om i ITSM-om

Prednosti za organizaciju

Izazovi i kako ih adresirati

Kako početi (minimalni koraci)

DEVOPS & SITE RELIABILITY ENGINEERING (SRE)

E-learning