• Génération IA
  • Posts
  • Une IA pour coder : Devin promet de révolutionner le développement logiciel

Une IA pour coder : Devin promet de révolutionner le développement logiciel

Avec un taux de résolution de 13,86% sur le benchmark SWE-bench, Devin, l'IA développée par Cognition Labs, surpasse largement les performances des modèles précédents et des développeurs humains

 En Bref. Cognition Labs présente Devin, le premier ingénieur logiciel IA entièrement autonome. Capable d'apprendre, de planifier et d'exécuter des tâches d'ingénierie complexes, Devin collabore activement avec les utilisateurs pour développer des applications de bout en bout.

La performance. Sur le benchmark SWE-bench, Devin résout correctement 13,86% des problèmes, dépassant largement l'état de l'art précédent de 1,96%. Même lorsqu'on lui fournit les fichiers exacts à modifier, les meilleurs modèles ne résolvent que 4,80% des problèmes.

Le financement. Cognition Labs, qui se concentre sur le raisonnement en IA, a levé 21 millions de dollars en Série A menée par Founders Fund. Des leaders de l'industrie comme Patrick et John Collison, Elad Gil ou encore Fred Ehrsam font partie des soutiens.

Le test. Un développeur a testé Devin et salue son approche axée sur l'expérience utilisateur. L'infrastructure entourant l'IA est la vedette, avec des fonctionnalités comme le déploiement automatique, la protection des clés API et une interface adaptée aux développeurs humains.

L'extension. En interagissant avec Devin, le développeur a réussi à créer une extension Chrome fonctionnelle qui transforme un dépôt GitHub en prompt pour l'IA Claude. Malgré quelques lenteurs, l'extension a été développée avec succès.

Sources : Cognition Labs et X