"Mer enn DNS: Det 14 timers AWS us-east-1-avbruddet" av Jonathon Belotti @jonobelotti_IO Godt forsøk på å forstå den ganske stumpe Amazon-rapporten. Postmortems i programvare/ops bør ikke bruke RCA (rotårsaksanalyse), men i stedet bruke rammeverket for: • Mekanisme: Den umiddelbare prosessen som resulterte i nedetid/feil (f.eks. null DNS-oppføring) • Årsak: Den spesifikke feilen som førte til de mekanistiske endringene (f.eks. løpstilstand) • Måte: Omstendighetene rundt feilen eller hvordan den skjedde (f.eks. kodefeil, menneskelig operatørfeil, maskinvarefeil, etc.) RCA er et for grovt instrument. Hele innlegget etter pausen...