Description :
Durée : 12 mois – renouvelable
Lieu de travail : Montréal
Bilinguisme : l'anglais est un atout
Télétravail : Hybride – 2 jours/semaine au bureau
Le Mandat
-
Bâtir et maintenir les pipelines CI/CD communs utilisés par la grande équipe.
-
Promouvoir les bonnes pratiques de résilience et de stabilité auprès des équipes applicatives et d’infrastructures.
-
Participer à l’introduction et à l’intégration du développement piloté par l’intelligence artificielle générative dans le cycle de développement.
-
Comprendre les flux principaux des environnements critiques et déceler les points de faiblesse uniques (single point of failure).
-
Supporter les équipes TI afin d’améliorer leur documentation et leurs diagrammes d’architecture pour inclure l’information sur la résilience et la stabilité.
-
Promouvoir et augmenter l’automatisation des tâches TI pour réduire les erreurs humaines.
-
Réaliser des analyses bout en bout de stabilité et formuler des recommandations pour améliorer la performance et la résilience des systèmes.
-
Promouvoir les bonnes pratiques de surveillance et soutenir les équipes TI dans l’implantation des indicateurs clés de résilience et de stabilité.
-
Assister les équipes TI à la suite d’événements majeurs impactant la résilience de leurs systèmes.
-
Participer à la refonte de l’architecture transversale du domaine de la carte de crédit.
-
Mettre au défi les collègues architectes, développeurs et designers afin de faire progresser l’équipe dans son ensemble.
-
Participer à une multitude de projets d’envergure.
-
Prendre part au support des applications développées par l’équipe selon le modèle « you build it, you run it ».
Prérequis
-
Expertise en conception logicielle de systèmes complexes supportant des milliers de clients simultanés.
-
Compétences confirmées avec les technologies GitHub Copilot et l’éditeur VS Code. Connaissance d’AWS Bedrock et OpenAI est un atout.
-
Excellente compréhension des principes DevSecOps, de la surveillance et de l’observabilité.
-
Expérience avec la technologie cloud AWS (développement de services, déploiement, automatisation et opérations).
-
Maîtrise des outils de surveillance (Datadog, CloudWatch, Splunk).
-
Expérience de travail avec des API.
-
Expérience dans un poste de leadership technologique.
-
Expérience opérationnelle 24/7.
-
Expérience en tests de charge et analyse.
-
Expérience en procédures de reprise après sinistre (Disaster Recovery).
-
Grande capacité à résoudre des problèmes complexes multi-systèmes.
Atouts supplémentaires
-
Expérience en développement piloté par l’intelligence artificielle générative ou projets d’automatisation intelligente.
-
Contribution à des projets open source ou communautaires en IA ou backend.
-
Intérêt pour la vulgarisation et le transfert de connaissances en IA auprès des équipes