Start / DeepSeek und Co scheitern am „Last Exam“

DeepSeek und Co scheitern am „Last Exam“

Ein neuer Test namens „Humanity’s Last Exam“ zeigt, dass selbst die fortschrittlichsten KI-Modelle wie DeepSeek und OpenAI-o1 bei komplexen Aufgaben scheitern. Diese Modelle lösen weniger als zehn Prozent der 3.000 gestellten Fragen korrekt. Der Test umfasst Fragen aus über 100 Fachgebieten und verdeutlicht, dass menschliche Experten in der Wissenschaft weiterhin überlegen sind. Trotz der aktuellen Schwächen der KI-Modelle erwarten Forscher, dass sie bis Ende 2025 signifikante Fortschritte machen. Dann könnten sie mehr als 50 Prozent der Aufgaben erfolgreich lösen. Dies würde helfen, die Entwicklung der künstlichen Intelligenz und ihre potenziellen Risiken besser einzuschätzen.

– Quelle: https://arxiv.org/abs/2501.14249

Markiert:

Aktuelle News


29. Januar 2025

Gehirn-Computer-Schnittstelle: Patient steuert Quadcopter allein mit Gedanken

Ein Team der Stanford University hat eine bahnbrechende Gehirn-Computer-Schnittstelle (BCI) entwickelt. Diese ermöglicht einem gelähmten Patienten die präzise Kontrolle über...
Lesen Sie weiter
29. Januar 2025

Alibaba präsentiert „Qwen 2.5-Max“: Neuer Herausforderer im KI-Rennen

Nach dem Aufsehen um die innovative KI von DeepSeek sorgt die chinesische Tech-Gigantin Alibaba mit ihrer neuen KI-Version „Qwen 2.5-Max“...
Lesen Sie weiter
29. Januar 2025

Risiko so hoch wie lange nicht: Neu entdeckter Asteroid könnte 2032 Erde treffen

Ein neu entdeckter Asteroid, 2024 YR4, hat eine Einschlagwahrscheinlichkeit von 1,2 Prozent und könnte sich am 22. Dezember 2032 bis...
Lesen Sie weiter
1 31 32 33

Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

4 × 4 =