Als (Senior) Site ReliabilityEngineer (SRE) in der Abteilung IT Plattformübernehmen Sie eine entscheidende Rolle bei der Gewährleistung der nachhaltigen Betriebssicherheit unserer unternehmenskritischen Anwendungen. In dieser lateralen Führungsrolle arbeiten Sie eng mit den SREs in den Anwendungsentwicklungsteams zusammen, um Best Practices zu etablieren, die Zuverlässigkeit zu verbessern und operative Exzellenz zu fördern. Neben der strategischen Ausrichtung und dem Mentoring ist auch die operative Mitwirkung im Tagesgeschäft ein wichtiger Bestandteil Ihrer Aufgaben. Wir suchen eine Persönlichkeit mit ausgeprägter Hands-on-Mentalität, die bereit ist, sich aktiv in die Lösung komplexer Probleme einzubringen.Laterale Führung und Mentoring: 
Sie agieren als Mentor/-in und Fachexpert/-in für SRE-Themen innerhalb der IT-Organisation, insbesondere für die SREs in den Entwicklungsteams. Sie fördern den Wissensaustausch und die Weiterentwicklung der SRE-Kompetenzen.Entwicklung und Implementierung von SRE-Strategien: 
In enger Zusammenarbeit mit den Entwicklungsteams und der IT Plattformdefinieren und implementieren Sie SRE-Prinzipien, Praktiken und Tools, um die Zuverlässigkeit, Performance und Effizienz unserer Anwendungen zu optimieren.Definition und Überwachung von SLOs/SLAs: 
Sie unterstützen die Entwicklungsteams bei der Definition von Service Level Objectives (SLOs) und Service Level Agreements (SLAs) für kritische Anwendungen und etablieren Mechanismen zur kontinuierlichen Überwachung und Einhaltung.Incident Management und Post-Mortem-Analysen: 
Sie wirken bei der Lösung von Incidents mit und fördern eine Kultur der transparenten Post-Mortem-Analysen, um aus Vorfällen zu lernen und präventive Maßnahmen abzuleiten.Automatisierung und Infrastruktur als Code:
 Sie treiben die Automatisierung wiederkehrender operativer Aufgaben voran und fördern den Einsatz von Infrastructure asCode (IaC), Praktiken zur Verbesserung der Stabilität und Reproduzierbarkeit unserer Infrastruktur.Etablierung von Monitoring und Alerting: 
Sie unterstützen bei der Konzeption und Implementierung von umfassenden Monitoring- und Alerting-Systemen, um Probleme frühzeitig zu erkennen und proaktiv zu handeln.Operative Mitwirkung und Troubleshooting:
 Sie packen aktiv mit an, wenn es um die Behebung von Incidents und die Durchführung von operativen Aufgaben geht. Die Analyse und das Troubleshooting komplexer Probleme in unserer Microservice-Architektur gehören ebenfalls zu Ihrem Verantwortungsbereich.Förderung einer DevOps-Kultur: 
Sie sind ein aktiver Verfechter der DevOps-Kultur und fördern die enge Zusammenarbeit und den Wissensaustausch zwischen Entwicklungs- und Betriebsteams.