Previous Next 


Frameworks de modélisation

Webinaire du 10 novembre 2020

Environnement Méca-Stat (MSE) : présentation de l'environnement et d'un cas d'étude

Olivier Bonnefon, Emily Walker (BioSP, Avignon), Jean-Paul Soularue (BIOGECO, Bordeaux)

MSE.pdf

Une problématique importante en biologie des populations et des communautés est d'élucider les processus régissant les interactions entre individus et espèces à partir d'observations censurées et indirectes. L'approche mécanistico-statistique couple des modèles mécanistes (déterministes ou stochastiques) à un modèle probabiliste décrivant les observations et permet de répondre à cet objectif. La modélisation du processus d’observation puis l’estimation de la vraisemblance du modèle selon les données peuvent être menées par des méthodes d’estimation bayésienne (échantillonneur de Gibbs par exemple) ou par des méthodes d’optimisation (ex: Quasi-Newton).

Nous présenterons un environnement développé pour faciliter la mise en œuvre de cette approche. Dans un premier temps, nous présenterons l’environnement dans son ensemble, puis nous focaliserons sur deux couplages mécanistico-statistiques (Equations différentielles/JAGS, Equations différentielles/Quasi-Newton). Dans un second temps, nous exposerons la mise en œuvre de MSE sur une étude menée en collaboration avec Jean-Paul Soularue portant sur la dispersion de Chalarose du frêne. Nous présenterons le contexte épidémiologique, les données, la construction d'un modèle mécaniste paramétré, le processus d'observation puis nous montrerons les premiers résultats.

Lors de la présentation de l'environnement MSE nous proposerons de réaliser quelques opérations via une image Docker de MSE. Si cela vous intéresse nous vous invitons à consulter la page https://informatique-mia.inrae.fr/mse/node/22 qui précise comment utiliser le module Docker de MSE. Attention: lors du premier appel Docker à MSE, l'image Docker est téléchargée sur votre machine, cette opération peut demander quelques heures. Nous vous conseillons de réaliser ce premier chargement avant la présentation.

 

EMULSION : vers des modèles épidémiologiques transparents, flexibles et multi-échelles

Sébastien Picault (BIOEPAR, Nantes)

Emulsion.pdf

Les modèles épidémiologiques mécanistes stochastiques contribuent largement à mieux comprendre l'émergence et la propagation des agents pathogènes, et à évaluer les stratégies de lutte à différentes échelles (de l'intra-hôte aux territoires). Le développement de modèles réalistes qui impliquent l'intégration de connaissances multidisciplinaires se heurte toutefois à trois défis majeurs en épidémiologie prédictive : le manque de lisibilité une fois traduit en code de simulation, la faible reproductibilité et réutilisabilité, et la longue durée de développement par rapport à l'échelle de temps de progression d'une épidémie.
Je présenterai la plateforme EMULSION, un "work in progress" destiné à résoudre ces problèmes et à aider les modélisateurs à se concentrer sur la conception de modèles plutôt que sur la programmation. EMULSION définit en effet un langage dédié (DSL) pour rendre tous les composants d'un modèle épidémiologique (structure, processus, paramètres...) explicites sous la forme d'un fichier texte structuré. Ce fichier est lisible par les scientifiques non-modélisateurs (épidémiologistes, biologistes, économistes), qui peuvent contribuer à valider ou à réviser les hypothèses à n'importe quel stade de développement du modèle.  Ce modèle est ensuite traité automatiquement par le moteur de simulation générique d'EMULSION, ce qui permet d'éviter toute divergence entre la description du modèle et son implémentation.
Le langage de modélisation et l'architecture de simulation reposent tous deux sur la combinaison de méthodes d'intelligence artificielle et de génie logiciel (représentation des connaissances via un DSL, simulation multi-agents multi-niveaux, design patterns) pour permettre la mise en œuvre de plusieurs paradigmes de modélisation (modèles à compartiments, modèles centrés individus) à plusieurs échelles (population/métapopulation).
EMULSION a fait la preuve de sa flexibilité et de sa capacité à construire des modèles incrémentalement (y compris des révisions tardives des hypothèses de base du modèle) notamment à travers la modélisation de la propagation de plusieurs maladies dans des pathosystèmes réels, dont je donnerai des exemples.
Écrit en Python 3, EMULSION fonctionne sous Linux, MacOS et Windows. Il est publié sous licence Apache-2.0. Une documentation complète avec des instructions d'installation, un tutoriel et de nombreux exemples sont disponibles à l'adresse suivante : https://sourcesup.renater.fr/www/emulsion-public. Je présenterai également les perspectives de cette approche tant du côté recherche (en informatique et en modélisation) que du côté ingénierie, avec notamment les limitations actuelles de la plateforme et les principales évolutions prévues.