Start / DeepSeek und Co scheitern am „Last Exam“

DeepSeek und Co scheitern am „Last Exam“

Ein neuer Test namens „Humanity’s Last Exam“ zeigt, dass selbst die fortschrittlichsten KI-Modelle wie DeepSeek und OpenAI-o1 bei komplexen Aufgaben scheitern. Diese Modelle lösen weniger als zehn Prozent der 3.000 gestellten Fragen korrekt. Der Test umfasst Fragen aus über 100 Fachgebieten und verdeutlicht, dass menschliche Experten in der Wissenschaft weiterhin überlegen sind. Trotz der aktuellen Schwächen der KI-Modelle erwarten Forscher, dass sie bis Ende 2025 signifikante Fortschritte machen. Dann könnten sie mehr als 50 Prozent der Aufgaben erfolgreich lösen. Dies würde helfen, die Entwicklung der künstlichen Intelligenz und ihre potenziellen Risiken besser einzuschätzen.

– Quelle: https://arxiv.org/abs/2501.14249

Markiert:

Aktuelle News


29. Januar 2026

Innovative Biopflaster aus dem 3D-Drucker für die Raumfahrt

Forschende des Berlin Institute of Health und des Unternehmens Cellbricks entwickelten einen innovativen 3D-Biodrucker, der in der Lage ist, individuell...
Lesen Sie weiter
29. Januar 2026

Hubble-Enthüllungen: KI entdeckt über 800 unerklärte Anomalien

Ein neuronales Netz, das speziell für die Analyse astronomischer Daten entwickelt wurde, durchforstete fast 100 Millionen Aufnahmen des Hubble-Weltraumteleskops und...
Lesen Sie weiter
27. Januar 2026

Frankreich stärkt digitale Souveränität mit eigener Videokonferenz-Software

Frankreich präsentiert mit Visio eine innovative Open-Source-Videokonferenzsoftware, die bis 2027 für 200.000 Beamte bereitgestellt wird. Diese Initiative zielt darauf ab,...
Lesen Sie weiter
23. Januar 2026

Superintelligenz als Chance für die Zukunft

Kognitionswissenschaftler Joscha Bach sieht in der Entwicklung von Superintelligenz eine bedeutende Chance für Wissenschaft und Gesellschaft. Er betont, dass Maschinen,...
Lesen Sie weiter
23. Januar 2026

Frühe Bildschirmnutzung schadet der Gehirnentwicklung

Eine neue Langzeitstudie zeigt, dass übermäßige Bildschirmzeit in den ersten zwei Lebensjahren die Gehirnreifung beschleunigt, jedoch die Denkflexibilität mindert und...
Lesen Sie weiter
19. Januar 2026

Sergey Brins Rückkehr: Eine erhellende Wendung im Ruhestand

Google-Mitgründer Sergey Brin kehrte enttäuscht aus dem frühzeitigen Ruhestand zurück, da er feststellte, dass ein Leben ohne Arbeit nicht erfüllend...
Lesen Sie weiter
2. Januar 2026

IT-Experten zieht es nach Polen

Polen wird zunehmend zum Ziel für deutsche IT-Fachkräfte, die von einem booming Technologiesektor und niedrigen Lebenshaltungskosten angezogen werden. Konzerne wie...
Lesen Sie weiter
2. Januar 2026

Jobs im europäischen Bankensektor durch KI bedroht

Laut einer Prognose von Morgan Stanley könnten bis 2030 über 210.000 Arbeitsplätze im europäischen Bankensektor wegfallen, da Banken zunehmend auf...
Lesen Sie weiter
12. Dezember 2025

Neue Erkenntnisse zur Vermeidung von Demenzfällen in Deutschland

Eine aktuelle Studie zeigt, dass über ein Drittel der Demenzfälle in Deutschland aufgrund veränderbarer Risikofaktoren verhindert werden könnte, darunter Bluthochdruck...
Lesen Sie weiter
12. Dezember 2025

Star‑Trek‑Fehler: Datas Katze Spot wechselte Geschlecht und Rasse

In „Raumschiff Enterprise: Das nächste Jahrhundert“ ändert sich Datas Katze Spot zwischen Staffel 4 und 6 von einer langhaarigen Somalikatze zu einer kurzhaarigen...
Lesen Sie weiter
1 2 3 33

Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

achtzehn − vier =