For Employers
ARCHITECTE INFRA CLOUD & GPU INTELLIGENCE ARTIFICIELLE (F/H)


Ministère de la Justice
ParisLocation
Paris
6 days ago
Posted date
6 days ago
N/A
Minimum level
N/A
Full-timeEmployment type
Full-time
La Direction du numérique recrute : rejoignez-la !

Le ministère de la Justice s'est engagé dans une dynamique de transformation numérique ambitieuse au profit d'une justice plus lisible, plus accessible et plus efficace. L'ambition est de faire du ministère de la Justice un acteur majeur dans le développement de l'administration numérique. La Direction du numérique définit ainsi, au regard des orientations interministérielles et en lien avec les directions et services, la stratégie de développement du numérique du ministère.

Vos missions

Rattaché(e) au département Infrastructures et des Services du Socle (ISS) et placé(e) sous la responsabilité du chef de département, vous intervenez en tant qu'Architecte Infra Cloud et GPU. À ce titre, vous devrez apporter votre expertise dans l'utilisation de GPU dans un contexte principalement Cloud mais aussi On premise. Vous devrez avoir une compréhension approfondie de l'architecture Cloud et GPU et être en capacité d'évaluer les performances de la pile matérielle et logicielle.

Vos principales missions (liste non-exhaustive) seront de :
• Concevoir et déployer une infrastructure GPU scalable et performante pour l'inférence des LLMs, capable de supporter jusqu'à plusieurs dizaines de milliers d'utilisateurs ;
• Mettre en place des mécanismes robustes de gestion des quotas, rate limiting et sécurité avancée ;
• Implémenter des solutions de monitoring et observabilité avancées (Prometheus, Grafana) ;
• Etablir les choix de système d'exploitation et des middlewares associés à ce contexte ;
• Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM (Triton, vLLM, Ray Serve)
• Assurer un support interne de niveau 3 sur ces produits ;
• Superviser le choix des frameworks, outils et technologies en collaboration avec les data scientists, ML engineers et devOps ;
• Garantir la scalabilité, la maintenabilité et la sécurité de l'infrastructure ;
• Évaluer l'impact technique et fonctionnel des choix architecturaux ;
• Mettre en place et développer des outils d'analyse et d'amélioration des performances ;
• Maitriser les couts d'usage et identifier et proposer des optimisations ;
• Assurer l'optimisation continue (load balancing, auto-scaling) et la haute disponibilité des systèmes ;

Votre profil

Intéressé(e) par le monde judiciaire et par le fonctionnement de la justice en France, vous êtes diplômé(e) d'une école d'ingénieur ou équivalent universitaire. Vous justifiez également 5 ans d'expérience dans un poste similaire.

Compétences requises
• Expérience dans le déploiement à grande échelle de systèmes distribués (multi-GPU, multi-modèles) ;
• Environnements matériels : processeurs, GPU, serveurs multiprocesseurs, interfaces de communication ;
• Compétences solides en sécurité et architecture Cloud (IAAS, CAAS)
• Environnement de développement liés aux GPUs : C/C++, CUDA, ROCM ;
• Système d'exploitation Linux : administration système, scripts d'automatisation (Bash, python, etc.), DHCP, Diskless, PXE ;
• Environnements de mesure et de gestion du rendement : logiciels de mesure de performances, outils de développement et de débogage système ;
• Connaissance du noyau et des sous-systèmes majeurs ;
• Maîtrise avancée des architectures microservices et conteneurisation (OpenShift, Kubernetes) ;
• Connaissance des pratiques CI/CD et Infrastructure as Code (Terraform, Kubernetes, GitLab) ;
• Connaissance des bases de données vectorielles (FAISS, Pinecode) ;
• Connaissance des langages Python, Java, Scala ;
• Connaissance en machine learning, deep learning ;
• Connaissance en gestion de modèles IA (MLOps, MLFlow, SageMaker...) ;
• Connaissance en data engineering (Spark, Kafka, Airflow) ;
• Connaissance en sécurité des systèmes IA (authentification protection des modèles, RGPD) ;
• Connaissances des process de Production et d'exploitation process ITIL ;
• Anglais technique est requis.

Avantages
  • Restauration d'entreprise à tarif dégressif
  • Télétravail jusqu'à 3 jours par semaine
  • Accessibilité en transport (RER E Rosa Parks, T3b, M12 Front populaire, M7 Corentin Cariou puis navette fluviale)
  • Parking privatif (vélo, voiture, scooter...)
  • Remboursement des frais des transports en communs à hauteur de 50% (selon plafonds fixé)
  • Association sportive et culturelle
  • Partenariat avec une crèche d'entreprise en Ile-de-France (Babilou)
  • Des opportunités d'évolutions (mobilité interne, ascendante)
  • Des opportunités de formation allant jusqu'à 3 formations par an
Related tags
-
JOB SUMMARY
ARCHITECTE INFRA CLOUD & GPU INTELLIGENCE ARTIFICIELLE (F/H)
Ministère de la Justice
Paris
6 days ago
N/A
Full-time

ARCHITECTE INFRA CLOUD & GPU INTELLIGENCE ARTIFICIELLE (F/H)