Le logiciel à succès ChatGPT proche de réussir un difficile examen de médecine aux Etats-Unis

14/02/2023

Le logiciel à succès ChatGPT, qui génère des textes grâce à l’intelligence artificielle, a obtenu un score s’approchant de celui requis pour réussir un difficile examen de médecine aux Etats-Unis, selon une étude publiée jeudi.

La start-up californienne OpenAI a lancé en novembre dernier un robot conversationnel, qui fait sensation depuis. Facile à utiliser, il produit des textes – rédactions, articles ou même poèmes – sur simple requête.

Pour l’étude, publiée dans la revue PLOS Digital health, des chercheurs de l’entreprise AnsibleHealth ont testé les performances du logiciel sur un examen que doivent passer les étudiants en médecine aux Etats-Unis, et qui les interrogent sur divers domaines (connaissances scientifiques, raisonnement clinique, bioéthique…). Dénommé USMLE (United States Medical Licensing Examination), cet examen est divisé en trois parties: la première passée après environ deux ans d’études, la deuxième au bout de quatre ans, et la troisième étant requise pour devenir médecin.

ChatGPT a été testé sur 350 des 376 questions publiées sur le site de l’USMLE et qui faisaient partie de l’examen de juin 2022. Les questions s’appuyant sur des images ont dû être retirées. Elles étaient présentées sous trois formats: des questions ouvertes («que serait le diagnostic pour ce patient compte tenu des informations présentées?»), des questions à choix multiples sans justification («Quelle est la prochaine étape de suivi la plus appropriée parmi les suivantes?»), et des choix multiples avec justification (Quelle est la raison la plus probable pour les symptômes nocturnes du patient? Expliquez votre raisonnement»). Deux examinateurs ont noté le travail, et un troisième a tranché les écarts entre eux. Le logiciel a obtenu un score situé entre 52,4% et 75% de bonnes réponses.

Généralement, le score nécessaire pour réussir l’examen est de 60% «ChatGPT s’approche de la marge de réussite», conclut l’étude. Certains experts extérieurs ont critiqué la méthode utilisée. Les chercheurs auraient pu introduire un certain degré d’anonymisation en mélangeant des réponses d’humains à celles du robot, a estimé Nello Cristianini, professeur en intelligence artificielle à l’université de Bath au Royaume-Uni. Il a malgré tout qualifié ces travaux comme faisant «partie d’une série de nouveaux développements enthousiasmants dans le domaine de l’intelligence artificielle» (IA). Selon Lucia Ortiz de Zarate, chercheuse à l’université autonome de Madrid, cette étude démontre «le potentiel de l’IA dans le domaine médical». Elle «peut se révéler d’une grande aide pour les médecins lorsqu’ils formulent des diagnostiques et prescrivent des traitements», a-t-elle jugé. Fin janvier, une autre étude avait montré que ChatGPT pouvait réussir les examens d’une université de droit américaine – quoiqu’en finissant dernier de la classe.

CNC : 69 films soutenus par le CNC, la France fortement…

Cannes 2026 : TV5MONDE et l’Institut français célèbrent le cinéma africain…

La Fémis au 79ème Festival de Cannes

Cannes 2026 : ARTE présente une trentaine de films et soutient…

France 3 : «Inspecteur Barnaby» en baisse

France Télévisions accuse les médias du groupe Bolloré de mener une…

M6 : le magazine «Capital» en baisse dimanche en Prime

Laurent Boyer condamné à 10 mois de prison avec sursis pour…

majelanX à bord de la Collection DS 3 Maison Sarah Lavoine

CTS Eventim s’associe à Pierre-Alexandre Vertadier pour investir le marché français…

La société de production Duck Factory lance Duck Ventura, sa nouvelle…

La société de production Duck Factory lance Duck Ventura, sa nouvelle…

La 9ème édition du festival LES FEMMES S’EXPOSENT du 5 juin…

L’INA et Florence Dauchez donnent la parole aux femmes reporters avec…

La Fifa tourne la page Panini et confie ses vignettes à…

Des auteurs étrangers annoncent boycotter Grasset après le limogeage de son…

Mamadou Sangaré remporte le Prix Marc-Vivien Foé RFI-France 24 du meilleur…

RMC BFM : Julie Gauchotte nommée Chief Digital Officer

RTL confirme son statut de radio la plus écoutée de France…

Fip : Barbra Streisand à l’honneur dans «Certains l’aiment Fip» le…

CANAL+ dévoile sa nouvelle campagne pour SuperSport en Afrique

E. DARQUIER (Brut.) : «Nous allons continuer à nous diversifier :…

Criteo révise à la baisse ses prévisions annuelles en raison des…

Sécurité routière: la suspension du permis pour téléphone au volant s’étend

Télécoms : selon les entreprises chinoises, leur bannissement coûterait très cher…

Bouygues : 8.500 recrutements prévus en France en 2026

La Fondation Bouygues Telecom célèbre ses 20 ans

Orange : c.a. en hausse de 3,5% au premier trimestre 2026

Génération Numérique annonce le retour du SATIS+ les 1er et 2…

e-Enfance alerte sur une explosion des violences numériques visant les mineurs,…

Google visé par une nouvelle action collective au Royaume-Uni pour abus…

Suède : un adolescent inculpé pour avoir orchestré des violences et…

Florent HOUZOT (beIN SPORTS) : «La Coupe du Monde de football…

Bruno LATAPIE (Dailymotion Advertising) : «Être au plus près des audiences,…

Aurélie REMAN (Sunny Side of the Doc) : «Une édition 2026…

Géraldine IGOU (Spotify) : «Plus de 90% des morceaux générés par…

Le logiciel à succès ChatGPT proche de réussir un difficile examen de médecine aux Etats-Unis

Aucun article à afficher