Pour les employeurs
Data Scientist F/H


Caisse de Depots
il y a un jour
Date de publication
il y a un jour
S/O
Niveau d'expérience
S/O
Temps pleinType de contrat
Temps plein
Missions et activités principales

Au sein de la Direction des prêts de la Banque des Territoires, en tant que Data Scientist vous serez à titre principal amené à réaliser divers études / analyses et à mettre en œuvre divers outils de machine learning. Vous pourrez être amené, ponctuellement et lorsque cela sera nécessaire, à participer à l'activité de production de données du service.

Les missions à réaliser seront variées :

Mise en œuvre d'algorithmes de text mining et de traitement du langage sur les différents documents à disposition de la direction des prêts (pièces justificatives des clients, etc.) :
  • Extraction automatique d'informations
  • Classification de documents
  • Amélioration de la qualité des données
Pour cela, la connaissance de différentes approches statistiques, dont l'utilisation de réseaux de neurones, est nécessaire. La mise en œuvre de ces techniques permettra, par exemple, de constituer automatiquement des bases de données pour fiabiliser les données de la DP et les enrichir d'informations supplémentaires. Vous participerez activement au développement de services destinés aux clients de la Direction, sur la base de ce type de technologies.

Travaux à réaliser sur les modèles larges de langage et sur l'ensemble de l'architecture liée à ces solutions :
  • Mise en œuvre du RAG, des solutions de type agent
  • Prétraitement des documents
  • Test et utilisation de différents LLM
Participation à l'industrialisation et à la bonne mise en œuvre de l'ensemble des outils de data sciences utilisées à DPHD80. Code sur Bitbucket, documentation des outils, mise en œuvre de packages, utilisation de Docker

Analyse / collecte de données :
  • Exploitation de bases de données en open data afin d'enrichir la connaissance client (base SQL, fichiers Parquet)
  • Récupération d'informations par web scraping
Profil attendu

Le recrutement à la Caisse des Dépôts est fondé sur les compétences, sans distinction d'origine, d'âge, ni de genre. Tous nos postes sont ouverts aux personnes en situation de handicap.


Vous avez :
  • Une formation scientifique supérieure (BAC+5)
  • Une solide expérience en modélisation / mathématiques appliquées et machine learning
  • Une utilisation avérée de LLM et des librairies liées (déploiement de petits LLM en local)
  • Une expérience avérée en estimation de modèle de Deep learning et en fine tuning de ces modèles (Bert).
  • Bonne maîtrise des dernières évolutions dans le domaine de l'IA et du deep learning.
  • un savoir-faire en mise en œuvre des outils d'IA dans le domaine du traitement du texte, de l'image et de données plus classiques.
  • Excellente connaissance de la programmation en particulier python et les librairies tensorflow, scikitlearn, pandas, numpy
  • Capacité à construire des solutions opérationnelles et industrialisables pertinentes

Qualités personnelles attendues :
Vous disposez des capacités personnelles suivantes :
Qualités d'analyse, de synthèse et de rédaction
Bonnes qualités relationnelles
Curiosité, rigueur, autonomie, capacité à faire des propositions innovantes.

Conditions de travail

Poste basé à Paris 72 avenue Pierre Mendes France
Temps de travail : Temps complet
Balises associées
-
RÉSUMÉ DE L' OFFRE
Data Scientist F/H
Caisse de Depots
Paris
il y a un jour
S/O
Temps plein

Data Scientist F/H