Pierre MONNIN, diplômé 2015 de TELECOM Nancy, reçoit le prix EGC 2022 de la meilleure thèse
Pierre Monnin, major de la promotion 2015 de TELECOM Nancy, a reçu le prix de la meilleure thèse dans le domaine de l’Extraction et la Gestion des Connaissances lors de la conférence francophone EGC 2022 qui s’est tenue à Blois du 24 au 28 janvier 2022.
La conférence Extraction et Gestion des Connaissances (EGC) est un événement annuel réunissant des chercheurs et praticiens de disciplines relevant des sciences des données et des connaissances.
Il s’agit là d’une très belle reconnaissance pour le travail mené par Pierre Monnin dans le cadre de sa thèse intitulée « Appariement et fouille dans les graphes de connaissances du web des données : applications en pharmacogénomique » et réalisée au sein du laboratoire LORIA – Université de Lorraine dans l’équipe « Orpailleur », dans le cadre du projet PractiKPharma financé par l’Agence Nationale de la Recherche (ANR).
Après avoir été diplômé de la promotion 2015 de TELECOM Nancy dans la spécialité « Ingénierie Logicielle », Pierre a souhaité s’orienter vers la recherche et a poursuivi en thèse au LORIA. Actuellement chercheur chez Orange à Belfort, Pierre Monnin a accepté de répondre à nos questions.
Bonjour Pierre Monnin, félicitations pour votre prix de la meilleure thèse EGC 2022 ! Pouvez-vous nous en dire plus sur ce prix ?
Merci ! Je suis ravi de partager cette reconnaissance avec la communauté de TELECOM Nancy. Ce prix de thèse est décerné chaque année au cours de la conférence EGC après étude par le bureau et le comité de pilotage de l’association EGC des dossiers envoyés par les candidats. Chaque candidat doit fournir son manuscrit de thèse, les rapports de soutenance et de pré-soutenance, ses deux meilleures publications, et son CV avec sa liste de publications. Après avoir obtenu de bons rapports de soutenance et de pré-soutenance et en avoir discuté avec mes directeurs de thèse, j’avais décidé de candidater.
En plus d’une reconnaissance de la qualité du travail qui peut être mise en valeur sur un CV, le lauréat du prix est invité à présenter ses travaux au cours de la conférence, ce qui permet d’accroître leur visibilité auprès de la communauté francophone de l’extraction et de la gestion des connaissances. Cela peut donc favoriser la réutilisation des travaux par d’autres chercheurs ou de nouvelles collaborations.
Sur quelles thématiques avez-vous travaillé dans le cadre de votre thèse ?
J’ai travaillé sur les problématiques d’appariement et de fouille dans les graphes de connaissances du Web des données. L’appariement vise à identifier des unités de connaissances équivalentes, plus spécifiques ou similaires au sein et entre graphes de connaissances. Cette tâche est cruciale car la publication et l’édition parallèles peuvent mener à des graphes de connaissances co-existants et complémentaires. La fouille permet quant à elle de découvrir de nouvelles connaissances.
Mes travaux ont été appliqués au domaine de la pharmacogénomique, qui étudie l’impact des facteurs génétiques des patients sur leur réponse aux médicaments. Les connaissances en pharmacogénomique proviennent de différentes sources (les bases de données spécialisées comme PharmGKB, la littérature biomédicale, les dossiers patients électroniques). Il est donc intéressant d’extraire ces connaissances et de les apparier pour fournir une vue consolidée des connaissances du domaine. Cette vue peut ensuite être fouillée pour découvrir de nouvelles connaissances comme des explications aux effets secondaires.
Dans le cadre de mes travaux, j’ai construit PGxLOD, un graphe de connaissances intégrant des connaissances pharmacogénomiques de différentes sources. J’ai proposé 2 méthodes d’alignement : une méthode symbolique à base de règles, et une méthode sub-symbolique à base de réseaux convolutifs de graphes. Concernant les problématiques de fouille, je me suis intéressé à la scalabilité de la fouille de chemins et motifs de chemins dans les graphes de connaissances. Ces chemins et motifs ont ensuite été utilisés dans une approche d’IA explicable pour étudier les mécanismes des effets secondaires de certains médicaments. J’ai également proposé une méthode d’amélioration des graphes de connaissances basée sur l’Analyse Formelle de Concepts.
Quel a été votre parcours après l’obtention de votre diplôme d’ingénieur ?
Après l’obtention de mon diplôme d’ingénieur, j’ai travaillé 9 mois en CDI chez Swiss AviationSoftware, entreprise dans laquelle j’avais effectué mon stage de fin d’étude. En parallèle, je continuais de travailler avec Adrien Coulet, enseignant-chercheur à TELECOM Nancy, sur l’extension et la valorisation d’un travail réalisé dans le cadre du projet du module SBC (Systèmes à Base de Connaissances) enseigné à l’école. Ce travail impliquait notamment des données issues des graphes de connaissances du Web des données. Au cours de cette première collaboration, il m’a présenté le projet PractiKPharma et l’offre de thèse qui était proposée.
Pourquoi avoir choisi de poursuivre dans la recherche ?
Le travail avec Adrien Coulet m’a permis d’avoir une première expérience de la recherche. En parallèle, mon stage de fin d’étude m’a permis de travailler sur un projet complexe et ambitieux, qui nécessitait de combiner plusieurs connaissances acquises à TELECOM Nancy (développement, compilation des langages par exemple).
Ces deux expériences combinées et concomitantes m’ont fait réaliser que j’avais envie d’un métier dynamique qui me permettait d’être sans cesse confronté à des défis scientifiques exigeants sans solution triviale. Cela m’a motivé à postuler pour une thèse puis à continuer une carrière de chercheur, mêlant innovation scientifique avec des travaux théoriques et expérimentaux, communications orales et écrites en français et en anglais, et collaboration avec des chercheurs de différents pays.
Quelle est votre fonction actuelle chez Orange et dans quels domaines travaillez-vous ?
Après ma thèse, j’ai rejoint Orange en tant que chercheur. Mes travaux actuels sont toujours liés aux graphes de connaissances et aux problématiques d’extraction, d’appariement et de fouille, mais appliqués à la gestion de jeux de données de domaines divers. Je continue donc la recherche scientifique tout en découvrant des problématiques de transfert industriel.
Conseilleriez-vous ce parcours « recherche » à de futurs diplômés de TELECOM Nancy ?
De mon point de vue, ce parcours « recherche » est une véritable opportunité pour de futurs diplômés qui souhaiteraient approfondir leurs connaissances scientifiques et travailler sur des problématiques complexes et innovantes. De plus, d’un point de vue humain, ce parcours est particulièrement enrichissant car naturellement associé à une expérience internationale (collaborations, conférences, publications) et à une grande diversité des activités (lecture d’articles scientifiques, travaux théoriques et expérimentaux, communications orales ou écrites en français ou en anglais par exemple).
Plus d’informations :
- La thèse de Pierre Monnin : http://www.theses.fr/2020LORR0212
- Le projet ANR PractiKPharma : http://practikpharma.loria.fr
- L’équipe Orpailleur : https://orpailleur.loria.fr