phD Lyon/San Francisco: analyse de spectres RMN par deep learning

Collaboration Lyon / San Franciso

Le doctorat sera effectué en partie au laboratoire CREATIS à Lyon www.creatis.insa-lyon.fr et en partie au laboratoire de Yan Li à l'Université de Californie San Fancisco https://lilabimaging.ucsf.edu dans le cadre d'une codirection international de thèse.

Contexte:

L'analyse des signaux des spectroscopies de résonance magnétique (SRM) à montrer qu'elle pouvait être une approche permettant d’aider à comprendre les voies métaboliques, neuronales majeurs impliquées dans les maladies cérébrales. Cependant, l’analyse des spectres acquis en contexte clinique, avec les méthodes actuelles, se trouve confrontée à un manque de robustesse, un manque d’objectivation des résultats, et d’automatisation des processus de traitement qui réduit le potentiel de la SRM en clinique, et que des approches par deep learning pourraient résoudre. En effet, les méthodes actuelles, qui sont basées sur des ajustements de modèles paramétriques. Elles peuvent être sujettes à des biais de modélisation, avec des résultats dépendant de la méthode de quantification utilisées voire même des paramétrages utilisés pour une même méthode. Le deep learning, tirera un maximum d'informations des bases de données de spectres réels et proposerait une analyse non assujettie aux simplifications d'une modélisation.

Etat de l'art:

Dans la littérature, l’apprentissage machine a été exploré et utilisé pour l’analyse de données SRM principalement pour la classification de spectres (spectres tumoraux et non tumoraux), le contrôle qualité. Cependant contrairement à ce qu’a vécu l’analyse des images médicales, l'analyse des signaux de SRM in vivo ont à peine commencé à bénéficier des avancées récentes en apprentissage profond (deep learning) [1], [2] [3] avec des problèmes très différents de ceux rencontrés dans la RMN à haute résolution utilisée en chimie ou en imagerie médicale.

Dans [1], un auto-encodeur convolutif est entraîné sur des données simulées pour reconstruire un spectrogramme sans artefact à partir de données contenant des artefacts. Dans [3], un CNN est entraîné à prédire l'évaluation d'un spectre ("bonne" ou "mauvaise qualité"). Nous avons pour notre part travaillé sur l'apprentissage profond pour la quantification des données et l'élimination des artefacts. À notre connaissance, nous avons été les premiers à tenter de quantifier les spectres RM sur des données synthétiques à l'aide d'un réseau neuronal convolutif [4]. Comme il n'existe pas de vérité de terrain pour les données in vivo, nous avons utilisé des données simulées avec des concentrations connues pour l'entraînement et le test. Les simulations s’appuyaient sur le modèle physique qui est généralement utilisé dans les méthodes de quantifications standard, qui réalisent un ajustement paramétrique d’un modèle aux données acquises. Nous avons également exploré l'architecture UNET pour corriger les artefacts de signal [5] . Cependant, cette architecture de réseau neuronal ne garantit pas la préservation du contenu en métabolites ou des propriétés physiques. Nous pensons que les contraintes des réseaux génératifs pour conserver certaines propriétés physiques telles que proposées dans ce projet seront plus adaptées et plus puissantes.

Description du projet

Le projet propose de s’appuyer sur le deep learning pour l’analyse de spectres RMN acquis in vivo chez des patients atteints de schizophrénie, en explorant les dernières évolutions méthodologiques en matière de modèles génératifs, de régression et de classification adaptés à l’analyse de spectres de résonance magnétique in vivo. Le projet bénéficiera d’une librairie en PyTorch mise en place dans le cadre d’un projet PNRIA qui prend en charge les données de spectroscopie RMN, peut réaliser une augmentation de données développement d’architectures typiques pour la classification, la régression et la génération de données adaptées. Certains paramètres (concentrations des métabolites, comportement spectral de la macromolécule etc ...) n'ont pas de "véritable vérité terrain" si bien qu'une approche totalement supervisée n'est pas envisageable. Ainsi, nous rechercherons des approches d'apprentissage non, faiblement ou semi supervisé pour ce problème.
Pour éviter les pièges du surajustement («overfitting») associés à la seule utilisation de données simulées, des techniques non supervisées, s'appuyant sur les modèles génératifs basés sur les scores [6], également connus sous le nom de modèle de diffusion, seront développées. Nous chercherons à développer des méthodes d'IA hybrides dédiées utilisant des données simulées avec une vérité de terrain, des données réelles non annotées (fournies dans le cadre d’études cliniques menées par l’équipe PSYR2 ou accessibles au public comme la base de données publique "Big GABA" pour commencer le travail) des données simulées avec le modèle physique de spectroscopie RMN utilisé dans les "approches classiques". Ce travail s'appuiera sur les progrès récents des modèles probabilistes de diffusion et proposera une nouvelle approche pour incorporer les propriétés/paramètres physiques dans les processus de diffusion et d'inversion. Plus précisément, nous explorerons un modèle probabiliste de diffusion conditionnelle qui, dans son processus inverse, peut intégrer certaines propriétés ciblées (par exemple sains/pas sains, contenant des résidus d’eau ou pas, contenant l’expression des macromolécules ou pas etc… ).
Contrairement aux problèmes rencontrés en vision par ordinateur, nous disposons d'un modèle mathématique (incomplet) issue de la physique permettant de modéliser le signal. Il sera primordiale de prendre en compte ce modèle physique pour l'apprentissage de modèle génératif ou d'analyse ce qui pourra nous conduire à utiliser des méthodes d'adaptation de domaine.

Résultats attendus

Le projet s'inscrit dans l'optique de développer une psychiatrie de précision, en améliorant les informations issues de la SRM in vivo, seule technique à apporter de façon endogène, non ionisante, et non invasive des informations sur la biochimie des tissus. Les techniques développées devraient permettre 1) de faciliter l'exploitation des données de spectroscopie en routine , 2) rendre robuste et fiable les données quantitatives extraites par rapport aux méthodes existantes et 3) pourraient aider à déceler des modifications métaboliques ou du profil spectral encore aujourd'hui non caractérisées qui aideraient à mieux comprendre les mécanismes sous jacents aux maladies psychiatriques, et aideraient aux choix thérapeutiques.

Candidature

Expérience/formation en: mathématiques appliquées, traitement d'images/ du signal ou apprentissage machine/profond.

Bonnes compétences en développement logiciel (idéalement avec python/pytorch).

Envoyez votre candidature (CV, lettre de recommandation, relevé de notes, ...) à michael.sdika[at]creatis.insa-lyon.fr et helene.ratiney[at]creatis.insa-lyon.fr.

Bibliographie

[1] S. P. Kyathanahally, A. Döring, et R. Kreis, « Deep learning approaches for detection and removal of ghosting artifacts in MR spectroscopy », Magn Reson Med, vol. 80, no 3, p. 851 863, sept. 2018, doi: 10.1002/mrm.27096.
[2] S. S. Gurbani et al., « A convolutional neural network to filter artifacts in spectroscopic MRI », Magnetic Resonance in Medicine, vol. 80, no 5, p. 1765 1775, 2018, doi: 10.1002/mrm.27166.
[3] S. Vaziri et al., « Evaluation of deep learning models for quality control of MR spectra », Frontiers In Neuroscience, vol. 17, août 2023, doi: 10.3389/fnins.2023.1219343.
[4] N. Hatami, M. Sdika, et H. Ratiney, « Magnetic Resonance Spectroscopy Quantification Using Deep Learning », Medical Image Computing And Computer Assisted Intervention - MICCAI 2018, PT I. in Lecture Notes in Computer Science, vol. 11070. Springer, Switzerland, p. 467 475. doi: 10.1007/978-3-030-00928-1_53.
[5] N. Hatami, H. Ratiney, et M. Sdika, « MR spectroscopy artifact removal with U-Net convolutional neural network », in 27th Annual meeting of the ISMRM, Montreal, Canada, mai 2019. https://hal.archives-ouvertes.fr/hal-02129946
[6] J. Ho, A. Jain, et P. Abbeel, « Denoising Diffusion Probabilistic Models », in Advances in Neural Information Processing Systems, Curran Associates, Inc., 2020, p. 6840 6851. 6 mars 2023. https://proceedings.neurips.cc/paper/2020/hash/4c5bcfec8584af0d967f1ab10179ca4b-Abstract.html