Übersicht

Für unseren Kunden, mit Sitz im GR München suchen wir einen erfahrenen Reliability Engineer:

Aufgaben mit Perspektive

– Etablierung von SRE-/DevOps-Praktiken sowie Beratung und Unterstützung der Entwicklungsteams.
– Sicherstellung einer hohen Systemstabilität durch Observability, Monitoring (z. B. Prometheus,
Grafana, Dynatrace) und vorausschauende Kapazitätsplanung.
– Definition, Überwachung und kontinuierliche Verbesserung von SLOs, SLIs und relevanten
Customer Journeys.
– Incident- und Performance-Management, inklusive Störungsbehebung, Root-Cause-Analysen
und Optimierung der Systemperformance.
– Automatisierung von Deployments sowie effiziente Skalierung der zugrunde liegenden Infrastruktur.
– Mitwirkung an Sicherheits- und Compliance-Anforderungen sowie Umsetzung etablierter
Best Practices.
– Coaching und Befähigung der Entwicklerteams im SRE-Mindset.

Profil

– Fundierte Erfahrung mit SRE-/DevOps-Methoden, Monitoring-Tools und modernen
Cloud-Technologien (z. B. Kubernetes, Docker).
– Ausgeprägtes analytisches Denken, Teamorientierung und sehr gute Kommunikationsfähigkeiten.
– Tiefgehendes Verständnis von Automatisierungsprozessen und Performance-Optimierung.
– Vertraut mit Konzepten wie SRE, SLIs, SLOs, Error Budgets und Toil-Reduktion.
– Expertise in der Stabilisierung und Skalierung geschäftskritischer Produktionssysteme.
– Kenntnisse in mindestens einer Skript- oder Programmiersprache (z. B. Bash, Perl, Python, Go, Node.js)
sowie sicherer Umgang mit Git.

Start: asap
Dauer: 6 Monate, Option  auf Verlängerung (ca. 18Monate)
Auslastung: 100%
Ort: remote & GR München (1 mal pro Quartal)

Wenn Ihnen das Projekt zusagt, freuen wir uns auf Ihre Rückmeldung mit Ihrem CV als Word-Datei, sowie Ihrem Stundensatz für remote und onsite (all in).

Lade deinen CV/Lebenslauf oder eine andere relevante Datei hoch. Maximale Dateigröße: 25 MB.