- Génération IA
- Posts
- Les avancées des grands modèles de langage en 2024
Les avancées des grands modèles de langage en 2024
Une synthèse nuancée de ce qu'il faut retenir des avancées des IA génératives en 2024, par Simon Willison, ingénieur et expert de l'IA.
Pour Simon Willison, 2024 a été une année charnière pour l'IA générative avec plusieurs percées majeures. Au delà du buzz, l’ingénieur propose un récapitulatif de ce qu’il faut retenir de 2024 pour ce qui concerne les grands modèles de langage (LLM) comme GPT-4…
Simon Willison est un programmeur britanique, son blog est une référence sur les sujets de programmation en général et sur l’IA en particulier.
Les grandes avancées
Démocratisation des performances :
De nombreux modèles ont dépassé GPT-4 (18 organisations)
Ces modèles sont devenus accessibles sur un simple ordinateur portable (exemple : Llama 3.3 70B sur MacBook)
Les prix ont chuté drastiquement (jusqu'à 27x moins cher qu'en 2023)
Multi-modalité :
Les modèles comprennent maintenant images, audio et vidéo
Exemple concret : vous pouvez montrer votre jardin à votre téléphone et discuter en direct avec l'IA des plantes que vous voyez
Les interactions vocales sont devenues naturelles, avec différents accents possibles
Création d'applications :
Les LLM peuvent générer des applications web complètes en une seule demande
Exemple : Claude peut créer une application d'extraction d'URLs fonctionnelle en quelques secondes
Impact environnemental :
Positif : l'efficacité énergétique par requête s'est améliorée (100x moins d'énergie qu'avec GPT-3)
Négatif : construction massive de centres de données énergivores
Les défis persistants
Agents IA : Malgré les promesses, les "agents" autonomes restent un concept flou. Le principal obstacle est que les LLM "croient" tout ce qu'on leur dit, les rendant peu fiables pour des tâches autonomes. Pour 2025, les experts restent sceptiques sur une percée majeure dans ce domaine.
Complexité d'utilisation : Les LLM sont devenus des outils puissants mais complexes, nécessitant une expertise pour en tirer le meilleur parti. C'est comme avoir une tronçonneuse déguisée en couteau de cuisine.
Distribution inégale des connaissances : Un fossé se creuse entre les experts et le grand public dans la compréhension et l'utilisation de ces technologies.
Perspectives 2025
Essor des modèles "raisonneurs" qui prennent plus de temps pour réfléchir (comme OpenAI o3)
Développement de l'IA multimodale avec des interactions toujours plus naturelles
Focus probable sur la démocratisation et la simplification d'utilisation
Poursuite de la baisse des coûts et amélioration de l'efficacité énergétique
Intensification du débat sur l'impact environnemental des centres de données