Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).

Enregistré le 12 novembre 2020

Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3

Interview Ta vie, ton oeuvre

Twotter Nicolas
Twitter Maxime
Criteo Labs

SRE en 2 phrases

Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ?

Pourquoi

Ops et dev, pourquoi “merger” ?
DevOps avec un sysadmin dans l’équipe vs SRE
Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?

SRE au quotidien

Journée type

Dashboard

On code en quoi?

Pager (pendant les horaires travails vs dehors)
Les weekends

Taille SRE pour pour du 24/7

Combien de fois est-on appelé par nuit ? Prod fallback

Le development

Livre: le projet Unicorn

Concepts intéressants

50% eng

SLO SLI SLA
La difficulté de la valeur initiale
Perf passées vs calcul théorique

Error budget
Blast radius
Burn rate

Pré conclusion

C’est la fin de la partie 1 de cette interview

Nous contacter

Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/
Flattr-ez nous (dons) sur https://lescastcodeurs.com/
En savoir plus sur le sponsoring? [email protected]

Twitter Mentions