🔧 Responsabilités principales
Assurer l’intégration et l’exploitation opérationnelle des applications de la plateforme.
Vérifier la conformité des livraisons : conventions de nommage, qualité des logs, documentation, monitoring.
Relire et améliorer la documentation de chaque release.
Définir et suivre les SLI/SLO, ainsi que les error budgets en collaboration avec les équipes de développement.
Configurer et maintenir dashboards, règles d’alerting et runbooks dans Datadog, tout en améliorant l’observabilité.
Corréler logs, traces et métriques pour diagnostiquer en profondeur les applications .NET, PHP, JavaScript (Datadog APM/Logs/RUM).
Mettre en place des mécanismes d’automatisation de l’exploitation : autoscaling, health probes, politiques de redémarrage automatique, procédures de failover.
Conduire des post-mortems constructifs, documenter les enseignements et piloter les actions correctives.
Mettre à jour et améliorer les pipelines de déploiement dans Azure DevOps.
Maintenir et faire évoluer les Helm charts utilisés pour les déploiements Kubernetes (AKS).
Intégrer SonarQube dans les pipelines pour renforcer la qualité du code.
Collaborer avec développeurs, tech leads et QA pour intégrer les tests automatisés dans les workflows CI/CD.
Assurer le support de niveau 3 et contribuer aux analyses post-incident.
🛠 Compétences techniques requises
Maîtrise des pipelines Azure DevOps (YAML, templates).
Expertise Kubernetes (AKS) et déploiements via Helm charts.
Pratique avancée de Datadog (APM, Logs, RUM, alerting, runbooks).
Connaissance de SonarQube et de son intégration CI/CD.
Bonne compréhension de Windows Server et des environnements hybrides.
Très bonne maîtrise des principes SRE : SLI/SLO, error budgets, observabilité, post-mortems.
Connaissances en C#, PHP ou JavaScript appréciées.
Familiarité avec Octopus Deploy est un atout.
Anglais courant indispensable.