Laboratoire Léon Brillouin

UMR12 CEA-CNRS, Bât. 563 CEA Saclay

91191 Gif sur Yvette Cedex, France

+33-169085241 llb-sec@cea.fr

Let's scatter neutrons

PDF
MAGES: Study of an AGent-based Model for the analysis of Experimental data acquired at the Soleil synchrotron and at the CEA Orphée reactor (UV fluorescence imaging, SAXS and SANS spectroscopy)

Spécialité

Mathématiques appliquées

Niveau d'étude

Bac+5

Formation

Master 2

Unité d'accueil

Candidature avant le

25/04/2023

Durée

6 mois

Poursuite possible en thèse

oui

Contact

Lutton Evelyne
+33 1 69 08 64 60

Résumé/Summary
Ce stage de recherche a pour but d'exploiter différentes données expérimentales pour enrichir un modèle multi-échelle à base d'agents. Il s'effectuera en collaboration avec l'unité MIA-Paris-Saclay de l’INRAE et concerne la modélisation de la digestion enzymatique humaine.
This research internship aims at exploiting different experimental data to enrich a multi-scale agent-based model. It will be carried out in collaboration with the MIA-Paris-Saclay unit of INRAE and concerns the modelling of human enzymatic digestion.
Sujet détaillé/Full description
Contexte :
Ce stage de recherche se déroulera dans le cadre d’une collaboration entre l’INRAE, le CEA-LLB et le synchrotron Soleil, concernant la compréhension de l’influence de la structure des aliments sur leur cinétique de digestion.
De nombreuses maladies de plus en plus fréquentes, en particulier pour les populations fragiles (les plus pauvres, les plus jeunes et les âgés), sont liées à la nutrition : diabète, obésité, pathologies cardiovasculaires. L’approche classique considère les compositions des aliments en termes de nutriments (hydrates de carbones, protéines, lipides) et de micro-nutriments (vitamines, polyphénols, par exemple) et la façon dont ils sont fractionnés sous l’action des enzymes pour délivrer les quantités adéquates au corps. Des travaux récents considèrent la digestion comme un processus beaucoup plus complexe, en particulier au regard de la cinétique de délivrance des nutriments le long du tube digestif (la plus connue étant celle du glucose) et de la structure. Les effets de la structure de l’aliment ont par ailleurs été récemment mis en évidence de façon expérimentale sur plusieurs types d’aliments (produits laitiers, viande, hydrates de carbone). Mieux comprendre et modéliser l’impact de la structure de l’aliment sur la digestion est une question importante, qui pourra avoir des répercussions variées dans le domaine de la nutrition (meilleure prise en charge de certaines pathologies, design d’aliments adaptés) ou de la pharmacodynamique.
La question de recherche est de caractériser l’effet, sur la cinétique de digestion de protéines, de la matrice, ici un gel, qu’elles peuvent former d’elles‐mêmes ou dans lequel elles seraient incluses. La structure - et donc l’évolution sous digestion - est très différente pour des gels laitiers où la brique élémentaire est l’amas de caséines (micelles), dont nous avons complété l’étude, et pour des gels formés par des protéines individuelles de colza (objet de cette étude).

Buts du stage
En s’appuyant sur ce cas d’étude décrit ci-dessus, où données et expertises sont disponibles en quantité, le stage a pour but d’élaborer une technique d’apprentissage interactif d’un modèle multi-échelle à partir de ces données. La difficulté est d’exploiter efficacement les données acquises sur les lignes DISCO (imagerie microscopique UV), SWING (spectroscopie diffraction X, SAXS) du synchrotron Soleil, et PAXY (spectroscopie diffraction neutrons, SANS) du réacteur Orphée du CEA. Le modèle considéré est un modèle multi-agents de réaction-diffusion (référence Azimi et al, ci-dessous), l’idée est de mettre en rapport les mesures aux deux échelles concernées (en macro via DISCO et en nano via SAXS/SANS).
L’imagerie DISCO (https://www.synchrotron-soleil.fr/fr/lignes-de-lumiere/disco) fournit des informations à des échelles entre 20 et 300 microns, elle a permis de visualiser séparément les effets d’HCl, et des enzymes (pepsine, bile, pancréatine) sur les protéines et le gras, et de suivre les cinétiques (de quelques minutes à plusieurs heures) de progression de la pepsine et la dissolution progressive de la forme et de la structure interne de morceaux de gels.
La diffraction X ou neutrons donne accès à des échelles plus fines (2-100 nanomètres), les données se présentent sous forme de spectres de diffraction (voir par exemple http://www.ustverre.fr/site/ustv/Oleron2013/Levelut.pdf)
La diffraction X aux petits angles (SAXS) a permis de suivre l’action de l’enzyme gastrique sur la ligne SWING (https://www.synchrotron-soleil.fr/fr/lignes-de-lumiere/swing)
• sur des gels laitiers avec deux effets: a) une forte modification des spectres (décroissance aux petits qs), traduisant la destruction progressive des micelles de caséine b) et un changement clair de profil correspondant à l’apparition d’entités plus petites (mini-micelles),
• sur des gels de protéines de colza.
La diffraction de neutrons aux petits angles (SANS)
• sur les gels laitiers par mélange H2O/D2O, nous avons pu visualiser ou éteindre séparément le signal des protéines et des lipides (non deutériés et aussi deutériés), et réussir de premiers suivis incluant la digestion intestinale. Les temps de comptage sur la ligne PAXY, assez courts, permettent un suivi cinétique. Ceci n’est pas directement possible sur une autre ligne comme TPA, mais le signal est suffisamment intense pour voir, en différé, l’évolution des gouttelettes lipidiques.
• sur certains gels de colza (digestion gastrique et intestinale).

Le modèle à base d’agents étudié a pour but de lier les informations expérimentales captées à ces deux échelles, en considérant l’action d’une population d’agents, les enzymes (un agent = un groupe d’enzymes), sur le substrat de protéines. Les spectres de diffraction, par le biais de fitting de modèles connus (sphères, agrégées ou non, polydisperses ou non), nous renseignent sur les tailles d’objets en présence et leur évolution au cours du temps, tandis que les images de fluorescence fournissent des informations sur la géométrie et la cinétique de diffusion. Ces données permettent d’apprendre différents paramètres du modèle, et d’en confronter la simulation (images, profils de tailles de populations, de dispersions, etc.) aux données expérimentales (ensembles d’apprentissage / de test).
Deux stages ont eu lieu en 2021 et 2022 sur cette thématique, ils ont permis de développer un modèle et de le confronter aux données DISCO d’une part et SAXS d’autre part. L’étape qui sera considérée au cours du présent stage consistera à développer une approche d’apprentissage mixte (fondée sur une optimisation interactive) permettant à la fois des apprentissages automatiques simultanés sur les deux jeux de données, pour effectivement mettre en rapport les deux échelles, et des remises en question interactives par un expert. Nous considèrerons avec attention la question de l’impact des incertitudes des données sur la stabilité des modèles.

Prérequis
• Bonnes compétences en programmation (python, matlab).
• Connaissances en apprentissage, IA, optimisation, modèles à base d’agents.
• Un intérêt pour les sciences expérimentales, la physico-chimie et la biologie.
Le stage pourra éventuellement déboucher sur une thèse sur la même thématique.
Lieu de travail
INRAE-AgroParisTech (Palaiseau) et/ou CEA-LLB (Saclay)
Encadrement
Evelyne Lutton, Alberto Tonda INRAE, UMR MIA-Paris-Saclay,
François Boué, LLB-CEA
Pour candidater
Envoyez CV, relevés de notes de Master et lettre de motivation à Evelyne.Lutton@inrae.fr et Francois.Boue@cea.fr
Quelques références
• Monitoring food structure during digestion using small-angle scattering and imaging techniques
J Pasquier, A Brûlet, A Boire, F Jamme, J Perez, T Bizien, E Lutton, ...
Colloids and Surfaces A: Physicochemical and Engineering Aspects 570, 96-106
https://hal.archives-ouvertes.fr/hal-02561464/document
• Exploring the breakdown of dairy protein gels during in vitro gastric digestion using time-lapse synchrotron deep-UV fluorescence microscopy
J Floury, T Bianchi, J Thévenot, D Dupont, F Jamme, E Lutton, Maud Panouillé, François Boué, Steven Le Feunteun
Food Chemistry 239, 898-910, 2018
https://hal.archives-ouvertes.fr/hal-01580650/
• Interactive Machine Learning for Applications in Food Science
A Tonda, N Boukhelifa, T Chabin, M Barnabé, B Génot, E Lutton, N Perrot
Human and Machine Learning, 459-477, 2018
https://hal.inrae.fr/hal-02791245
• Evaluation of Interactive Machine Learning Systems
N Boukhelifa, A Bezerianos, E Lutton
Human and Machine Learning, 341-360, 2018
https://arxiv.org/abs/1801.07964
• Exploring the diffusion of pepsin and hydrolysis kinetics of dairy protein gels during simulated gastric digestion using advanced microscopic techniques.
J Floury, J Thevenot, D Dupont, F Jamme, E Lutton, M Panouille, F Boue, S Le Feunteun
Food Structures, Digestion & Health International Conference, 2017
https://hal.archives-ouvertes.fr/hal-01651304/
• Evolution of food gel structures during simulated gastro-intestinal digestion using Small Angle Scattering at SOLEIL synchrotron
E Lutton, J Thevenot, S Le Feunteun, J Floury, M Panouille, D Dupont, Pierre Roblin, François Boue
International Conference on Food Digestion, 2017
https://hal.archives-ouvertes.fr/hal-01581553/
• Accounting for Diffusion in Agent Based Models of Reaction-Diffusion Systems with Application to Cytoskeletal Diffusion
Mohammad Azimi, Yousef Jamali, Mohammad R. K. Mofrad
PLoS ONE 6(9): e25306. doi:10.1371/journal.pone.0025306
http://biomechanics.berkeley.edu/wp-content/uploads/papers/Azimi%202011%20PLoSOne.pdf
See above, in french.
Mots clés/Keywords
Apprentissage, modélisation interactive, visualisation
Machine learning, interactive modeling, visualisation
Compétences/Skills
Apprentissage, modèles à base d'agents, traitement du signal.
Machine learning, agent-based models, signal processing.
Logiciels
Python, Matlab
PDF
Modeling of the solution structure of membrane proteins: combination of SAXS/SANS experiments and ab initio reconstruction methods

Spécialité

Biophysique

Niveau d'étude

Bac+5

Formation

Master 2

Unité d'accueil

Candidature avant le

28/04/2023

Durée

6 mois

Poursuite possible en thèse

oui

Contact

COMBET Sophie
+33 1 69 08 67 20

Résumé/Summary
Notre objectif est de développer une nouvelle méthodologie basée sur la combinaison d’expériences de diffusion aux petits angles de neutrons et de rayons X (SANS/SAXS) et de modélisations ab initio (gros grains/tout atome) permettant (i) d’obtenir des informations structurales à basse résolution de protéines membranaires de structure inconnue ou de structure connue mais mal repliées ; (ii) de décrire la structure des amphiphiles associés à ces protéines (couronnes de détergents et/ou de lipides)
Our objective is to develop a new methodology based on the combination of neutron and X-ray small-angle scattering (SANS/SAXS) experiments and ab initio modeling (coarse grain/all atom) allowing (i) to obtain low-resolution structural information of membrane proteins of unknown structure or of known structure but misfolded; (ii) to describe the structure of the amphiphiles associated with these proteins (belts of detergents and/or lipids).
Sujet détaillé/Full description
La détermination de la structure des protéines membranaires à l’échelle atomique est un défi en biologie structurale du fait de la nécessité d’utiliser des amphiphiles pour les solubiliser et les manipuler in vitro. Seulement 3% des entrées de la «Protein Data Bank» (PDB) concernent des protéines membranaires alors qu’elles représentent 30% des protéines et constituent près de 60% des cibles thérapeutiques.

Notre objectif est de développer une nouvelle méthodologie basée sur la combinaison d’expériences de diffusion aux petits angles de neutrons et de rayons X (SANS/SAXS) et de modélisations ab initio (gros grains/tout atome) permettant (i) d’obtenir des informations structurales à basse résolution de protéines membranaires de structure inconnue ou de structure connue mais mal repliées ; (ii) de décrire la structure des amphiphiles associés à ces protéines (couronnes de détergents et/ou de lipides).
Nous étudions la protéine TSPO (pour TranSlocator PrOtein) de souris (mTSPO), une protéine transmembranaire d’intérêt pharmacologique majeur : TSPO est une cible pour le diagnostic et la thérapie de plusieurs pathologies inflammatoires et cancéreuses et un marqueur de maladies neurodégénératives.
Les mesures de SANS permettent de caractériser spécifiquement la structure de la protéine mTSPO en rendant « invisble » le signal de la couronne, grâce à des substitutions isotopiques. Un premier objectif du stage est d'obtenir à partir de ces mesures la structure à basse résolution de mTSPO avec des méthodes de reconstruction ab initio de type Monte Carlo. Un second objectif est rendre lisible le fichier « PDB » (données structurales) de l’enveloppe obtenue par SANS par le logiciel MEMPROT. Ce logiciel, qui permet de déterminer la forme de la couronne associée à une protéine membranaire, ne fonctionne actuellement qu’à partir d’un fichier PDB provenant de mesures de cristallographie des rayons X. Cette étape nécessitera de modifier le code du logiciel MEMPROT et les fichiers des enveloppes obtenues par SANS.

Un troisième objectif est d’utiliser la même approche dans le cas d’une protéine membranaire partiellement dépliée. Dans ce cas, le logiciel DADIMODO, initialement prévu pour le SAXS et permettant des déplacements importants de parties d’une protéine, sera également adapté pour modifier la structure de la protéine à partir de l’ajustement d’une courbe de SANS.
Selon l’avancement du stage, des simulations de dynamique moléculaire (classique ou interactive) pourront compléter cette étude, en utilisant les enveloppes de SANS/SAXS comme contraintes spatiales.

Profil recherché: étudiant(e) en bio-informatique sachant coder en Python et fortement intéressé(e) par la biologie structurale des protéines. Bon niveau d’anglais requis.

Ce stage sera basé au LLB (Univ. Paris-Saclay) et sera co-encadré par S. Combet (LLB) pour la partie diffusion et A. Koutsioumpas (source de neutrons, Munich, Allemagne) pour la partie modélisation. Il sera réalisé en étroite collaboration avec F. Bonneté (IBPC, Paris), JJ. Lacapère (LBM, Paris), et S. Finet (IMPMC, Paris) experts des surfactants et de la protéine TSPO, ainsi qu’avec J. Pérez et A. Thureau (synchrotron SOLEIL, St-Aubin) qui ont développé les logiciels MEMPROT et DADIMODO.

Contact : Sophie COMBET (DR CNRS) 01 69 08 67 20
sophie.combet@cea.fr
Determining the structure of membrane proteins at the atomic scale is a challenge in structural biology because of the need to use amphiphiles to solubilize and manipulate them in vitro. Only 3% of entries in the “Protein Data Bank” (PDB) relate to membrane proteins, even though they represent 30% of proteins and constitute almost 60% of therapeutic targets.
Our objective is to develop a new methodology based on the combination of neutron and X-ray small-angle scattering (SANS/SAXS) experiments and ab initio modeling (coarse grain/all atom) allowing (i) to obtain low-resolution structural information of membrane proteins of unknown structure or of known structure but misfolded; (ii) to describe the structure of the amphiphiles associated with these proteins (belts of detergents and/or lipids).
We study the mouse protein TSPO (for TranSlocator PrOtein) (mTSPO), a transmembrane protein of major pharmacological interest: TSPO is a target for the diagnosis and therapy of several inflammatory and cancerous pathologies and a marker of neurodegenerative diseases.
SANS measurements make it possible to specifically characterize the structure of the mTSPO protein by making the signal of the belt "invisible", thanks to isotopic substitutions. A first objective of this M2 training is to obtain from these measurements the low resolution structure of mTSPO with ab initio Monte Carlo reconstruction methods. A second objective is to make the “PDB” file (structural data) of the envelope obtained by SANS readable by the MEMPROT software. This software, which makes it possible to determine the shape of the belt associated with a membrane protein, currently only works from a PDB file originating from X-ray crystallography measurements. This step will require modifying the code of the MEMPROT software and envelope files obtained by SANS.

A third objective is to use the same approach in the case of a partially unfolded membrane protein. In this case, the DADIMODO software, initially planned for SAXS and allowing large displacements of parts of a protein, will also be adapted to modify the structure of the protein from the adjustment of a SANS curve. Depending on the progress of the training, molecular dynamics simulations (classic or interactive) may complete this study, using the envelopes of SANS/SAXS as spatial constraints.

Profiles: student in bioinformatics knowing how to code in Python and strongly interested in the structural biology of proteins. Good level of English required.

This training will be based at LLB (Univ. Paris-Saclay) and will be co-supervised by S. Combet (LLB) for the scattering part and A. Koutsioumpas (neutron source, Munich, Germany) for the modeling part. It will be produced in close collaboration with F. Bonneté (IBPC, Paris), JJ. Lacapère (LBM, Paris), and S. Finet (IMPMC, Paris) experts in surfactants and the TSPO protein, as well as with J. Pérez and A. Thureau (SOLEIL synchrotron, St-Aubin) who developed the MEMPROT and DADIMODO softwares.

Contact : Sophie COMBET (CNRS Research Director) 01 69 08 67 20
sophie.combet@cea.fr
Mots clés/Keywords
Bio-informatique, Python, protéines membranaires, expériences de diffusion de rayonnement, grands instruments
Bioinformatics, Python, membrane proteins, scattering experiments, large scale instruments
Compétences/Skills
Utilisation de méthodes de simulations Monte Carlo (programmes existants) sur des données d'expériences de SANS/SAXS. Codage en Python pour adapter certains programmes existants.
Use of Monte Carlo simulation methods (existing programs) on SANS/SAXS experimental data. Coding in Python to adapt some existing programs.
Logiciels
Python Simulations Monte Carlo Dynamique moléculaire

 

Retour en haut