Studie findet KI wie ChatGPT führt schlecht in echten medizinischen Gesprächen trotz einer guten Bewertung auf Tests.

Forscher der Harvard Medical School und der Stanford University fanden heraus, dass KI-Modelle wie ChatGPT zwar bei standardisierten medizinischen Tests gut abschneiden, ihre Wirksamkeit in medizinischen Gesprächen in der realen Welt jedoch begrenzt ist. Die Studie nutzte ein neues Evaluations-Framework namens CRAFT-MD, das reale klinische Interaktionen simuliert. Die KI-Modelle kämpften damit, Patienteninformationen zu sammeln und genaue Diagnosen zu erstellen, wobei die Notwendigkeit realistischerer Testmethoden hervorgehoben wurde, bevor diese Werkzeuge in klinischen Situationen eingesetzt werden.

Vor 3 Monaten
10 Artikel