Webinaire sur les grands modèles de langage
Les LLM, principes de fonctionnement et cas d’utilisation
Les récentes avancées en Intelligence Artificielle (IA) s'appuient sur l'architecture Transformer introduite par Vaswani et al. en 2017. Cette architecture a jeté les bases des LLM (Large Langage Model), comme ChatGPT d'OpenAI, lancé en novembre 2022. Les LLM marquent une avancée significative dans le traitement du langage naturel. Entraînés à partir des millions de documents, ils permettent de comprendre et générer du texte avec une finesse inégalée. Des modèles tels que GPT-4 illustrent leur capacité à réaliser diverses tâches, telles que la création de contenu, la traduction en différentes langues, le résumé de texte ou l’aide à l’écriture de code source.
Jusqu'au début de l’année 2023, les LLM étaient principalement développés par des entreprises privées. Néanmoins, plusieurs projets Open Source ont été lancés par la communauté scientifique en informatique, offrant un accès libre à ces technologies avancées. Cette évolution a plusieurs implications. Elle élargit l'accès à ces nouvelles technologies, stimulant ainsi l'innovation et le développement de nouvelles applications. L'accès ouvert aux données et aux codes des LLM augmente la fiabilité et la transparence de ces modèles, dans l’optique de prévenir les potentiels biais et les dérives éthiques.
Au cours de ce webinaire, nous introduirons tout d’abord la notion de LLM, puis nous aborderons leurs principes de fonctionnement et nous présenteront quelques cas d’utilisation et d’intégration au sein d’applications.
Intervenants :
- Jocelyn DE GOËR : UMR EPIA
- Arnaud FERRE : UR MaIAGE
Inscription :
Le formulaire d’inscription se trouve à cette adresse : https://sondages.inrae.fr/index.php/838726?lang=fr