Ingénieur Python NLP pour une application de fact-checking
Inria
il y a 10 jours
Date de publicationil y a 10 jours
S/O
Niveau d'expérienceS/O
Temps pleinType de contrat
Temps pleinDevOps / CloudCatégorie d'emploi
DevOps / CloudA propos du centre ou de la direction fonctionnelle
Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s'inscrit dans le développement du plateau de Saclay, en partenariat étroit d'une part avec le pôle de l'Université Paris-Saclay et d'autre part avec le pôle de l'Institut Polytechnique de Paris. Afin de construire une politique de site ambitieuse, le centre Inria de Saclay a signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.
Le centre compte , dont 27 sont communes avec l'Université Paris-Saclay ou l'Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes , scientifiques et personnels d'appui à la recherche et à l'innovation, issues de 54 nationalités.
Contexte et atouts du poste
Inria est une institution publique qui promeuve la contribution de la science à la société : il forme des scientifiques et produit des connaissances. Radio France, grande institution du service public, premier groupe radiophonique de France, est structure' autour de 4 missions : informer, e'duquer, cultiver, divertir.
L'importance croissante de la de'sinformation et la ne'cessite' de disposer rapidement de ve'rifications d'informations qui circulent sur les me'dias ont fait e'merger un projet de collaboration autour de la de'tection automatique des infox.
Depuis 2022, nous développons StatCheck, un système de vérification des faits spécialisé dans les médias français. Nous avons développé StatCheck dans le cadre d'une collaboration entre des chercheurs en informatique et des journalistes de Radio France.
StatCheck se compose de 3 composants principaux :
1. Un pipeline pour l'exploration, le nettoyage et l'indexation de données statistiques de haute qualité, notamment de l'INSEE et d'Eurostat.
2. Un moteur de recherche sur les données récupérées.
3. Un pipeline pour détecter à partir du texte les affirmations et les entités statistiques dignes d'être vérifiées, affirmations qui peuvent ensuite être vérifiées à l'aide du moteur de recherche.
Plus d'informations sur StatCheck: https://team.inria.fr/cedar/projects/statcheck/
Mission confiée
L'ingénieur sera chargé de :
- améliorer notre moteur de recherche sur les données statistiques en ajoutant un chatbot qui pourrait traiter des requêtes plus complexes ;
- aider nos collaborateurs de RadioFrance sur les demandes liées à la base de code ;
- maintenir la base de code existante.
Principales activités
Principales activés (5 maximum) : maintenir la base de code existante; améliorer les modules existants ; implémenter de nouvelles fonctionnalités
Activités complémentaires (3 maximum) : aider à la publication d'un article de recherche si les résultats le permettent
Compétences
Compétences techniques et niveau requis : bonnes compétences en programmation
Langues : Français, Anglais
Avantages
Rémunération
Selon expérience
Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s'inscrit dans le développement du plateau de Saclay, en partenariat étroit d'une part avec le pôle de l'Université Paris-Saclay et d'autre part avec le pôle de l'Institut Polytechnique de Paris. Afin de construire une politique de site ambitieuse, le centre Inria de Saclay a signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.
Le centre compte , dont 27 sont communes avec l'Université Paris-Saclay ou l'Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes , scientifiques et personnels d'appui à la recherche et à l'innovation, issues de 54 nationalités.
Contexte et atouts du poste
Inria est une institution publique qui promeuve la contribution de la science à la société : il forme des scientifiques et produit des connaissances. Radio France, grande institution du service public, premier groupe radiophonique de France, est structure' autour de 4 missions : informer, e'duquer, cultiver, divertir.
L'importance croissante de la de'sinformation et la ne'cessite' de disposer rapidement de ve'rifications d'informations qui circulent sur les me'dias ont fait e'merger un projet de collaboration autour de la de'tection automatique des infox.
Depuis 2022, nous développons StatCheck, un système de vérification des faits spécialisé dans les médias français. Nous avons développé StatCheck dans le cadre d'une collaboration entre des chercheurs en informatique et des journalistes de Radio France.
StatCheck se compose de 3 composants principaux :
1. Un pipeline pour l'exploration, le nettoyage et l'indexation de données statistiques de haute qualité, notamment de l'INSEE et d'Eurostat.
2. Un moteur de recherche sur les données récupérées.
3. Un pipeline pour détecter à partir du texte les affirmations et les entités statistiques dignes d'être vérifiées, affirmations qui peuvent ensuite être vérifiées à l'aide du moteur de recherche.
Plus d'informations sur StatCheck: https://team.inria.fr/cedar/projects/statcheck/
Mission confiée
L'ingénieur sera chargé de :
- améliorer notre moteur de recherche sur les données statistiques en ajoutant un chatbot qui pourrait traiter des requêtes plus complexes ;
- aider nos collaborateurs de RadioFrance sur les demandes liées à la base de code ;
- maintenir la base de code existante.
Principales activités
Principales activés (5 maximum) : maintenir la base de code existante; améliorer les modules existants ; implémenter de nouvelles fonctionnalités
Activités complémentaires (3 maximum) : aider à la publication d'un article de recherche si les résultats le permettent
Compétences
Compétences techniques et niveau requis : bonnes compétences en programmation
Langues : Français, Anglais
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail et aménagement du temps de travail
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
Rémunération
Selon expérience
RÉSUMÉ DE L' OFFRE
Ingénieur Python NLP pour une application de fact-checkingInria
Palaiseau
il y a 10 jours
S/O
Temps plein