Pour les employeurs
Ingénieur Développement et intégration de technologies de compilation optimisantes dans un framework de code génération pour l'inférence.
Inria
il y a 11 jours
Date de publication
il y a 11 jours
S/O
Niveau d'expérience
S/O
Temps pleinType de contrat
Temps plein
A propos du centre ou de la direction fonctionnelle

The Centre Inria de l'Université de Grenoble groups together almost 600 people in 22 research teams and 7 research support departments.

Staff is present on three campuses in Grenoble, in close collaboration with other research and higher education institutions (Université Grenoble Alpes, CNRS, CEA, INRAE, ...), but also with key economic players in the area.

The Centre Inria de l'Université Grenoble Alpe is active in the fields of high-performance computing, verification and embedded systems, modeling of the environment at multiple levels, and data science and artificial intelligence. The center is a top-level scientific institute with an extensive network of international collaborations in Europe and the rest of the world.

Contexte et atouts du poste

Dans le cadre d'un partenariat (vous pouvez choisir entre)
  • Collaboration avec le CEA (developeur du framework d'inférence)
  • Dans le cadre du PEPR IA 2030

L' objectif est de

Intégrer des technologies de compilations développées dans l'équipe pour l'optimisation d'opérateurs (algèbre linéaire essentiellement) dans un framework de génération de code pour un réseau complet (c.à.d. graphe dataflow d'opérateus).

Des déplacements réguliers sont prévus pour ce poste ?

Pour une bonne interopérabilité avec le framework principal, il serait prévu des déplacement régulier sur Pris-Saclay lieu de résidence des équipes du CEA:
  • 2 jours par mois environ

Mission confiée

Missions :

Développement et intégrations de techniques avancées telles que:
  • les transformations automatiques au niveau coeur (parallélisation, tuilage, packing/pading)
  • la fusion d'opérateurs
  • la génération de code pour opérateurs quantisés
  • l'auto-tuning avec boucle de feedback compilation->exécution
  • la gestion de la distribution sur machines à hierarchie mémoire distribuée

Collaboration :

Lien avec les chercheurs de l'équipe pour le dévelopement et l'intégration des backends de compilation existants.

Lien avec les partenaires du CEA dévelopeurs de la plateforme d'inférence.

Responsabilités :

Initiative sur les choix de dévelopement/infrastructure et l'architecture logicielle.

Pilotage/Management :

Autonomie requise pour le suivi des travaux de l'équipe sur le sujet et la proposition de réunions si besoin.

Principales activités

Principales activités:
  • utilisation des platformes de génération de code pour l'inférence à partir des front-ends classiques d'IA (pytorch, tflite) et de leurs backends (MLIR, TVM, LLVMIR)
  • contributions à la plateforme du CEA
  • contributions aux optimization et langages de transformations développés dans l'équipe
  • prototypage et intégration pour compilation optimisée end-to-end native/jit compilation et cross-plateforme compilation/execution
  • benchmarking sur des plateformes cibles telles que x86, ARM CPU ou avec copros

Compétences

Compétences
  • architecture logicielle, architecture des ordinateurs
  • analyse/transformations de graphes de calculs
  • compilation, cross-compilation
  • dévelopmement sous environement Linux
  • C++/python/assembleur x86 et/ou ARM

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (90 jours par an) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale
  • Participation à la mutuelle (sous conditions)
Balises associées
-
RÉSUMÉ DE L' OFFRE
Ingénieur Développement et intégration de technologies de compilation optimisantes dans un framework de code génération pour l'inférence.
Inria
Grenoble
il y a 11 jours
S/O
Temps plein