Start / DeepSeek und Co scheitern am „Last Exam“

DeepSeek und Co scheitern am „Last Exam“

Ein neuer Test namens „Humanity’s Last Exam“ zeigt, dass selbst die fortschrittlichsten KI-Modelle wie DeepSeek und OpenAI-o1 bei komplexen Aufgaben scheitern. Diese Modelle lösen weniger als zehn Prozent der 3.000 gestellten Fragen korrekt. Der Test umfasst Fragen aus über 100 Fachgebieten und verdeutlicht, dass menschliche Experten in der Wissenschaft weiterhin überlegen sind. Trotz der aktuellen Schwächen der KI-Modelle erwarten Forscher, dass sie bis Ende 2025 signifikante Fortschritte machen. Dann könnten sie mehr als 50 Prozent der Aufgaben erfolgreich lösen. Dies würde helfen, die Entwicklung der künstlichen Intelligenz und ihre potenziellen Risiken besser einzuschätzen.

– Quelle: https://arxiv.org/abs/2501.14249

Markiert:

Aktuelle News


16. August 2025

Fliegende Nano-Plattformen revolutionieren die Atmosphärenforschung

Ingenieure haben neuartige, solarbetriebene Nano-Plattformen entwickelt, die in der Mesosphäre der Erde schweben können, um Klimamessgeräte und Telekommunikationsantennen zu tragen....
Lesen Sie weiter
16. August 2025

Rückgang des Web-Traffics durch Googles KI-Zusammenfassungen

Eine aktuelle Studie zeigt, dass Googles KI-Übersichten den Traffic auf Verlagswebsites um bis zu 25 Prozent verringern. Verleger argumentieren, dass...
Lesen Sie weiter
14. August 2025

Gefährlicher Beautytrend: Tanlines schaden unserer Haut

Der Trend zu Tanlines, bei dem der Kontrast zwischen gebräunter und blasser Haut in sozialen Medien gefeiert wird, birgt erhebliche...
Lesen Sie weiter
14. August 2025

AOL beendet Modem-Zugang zum Internet nach 34 Jahren

AOL hat angekündigt, den Modem-Zugang zum Internet am 30. September 2025 einzustellen, was das Ende einer Ära für viele Nutzer...
Lesen Sie weiter
12. August 2025

Klimakrise im Anthropozän: Dringender Handlungsbedarf erforderlich

Der Artikel beleuchtet die kritische Lage des Erdsystems im Anthropozän und die Notwendigkeit, die gegenwärtigen Trends zu durchbrechen, um katastrophale...
Lesen Sie weiter
12. August 2025

Hintergründe zur aufstrebenden Longevity-Industrie in Österreich

Die Longevity-Industrie boomt in Österreich, verspricht eine lange Jugend durch futuristische Therapien und Nahrungsergänzungsmittel. Doch Experten warnen vor fragwürdigen und...
Lesen Sie weiter
12. August 2025

Neue Studie hinterfragt die Denkfähigkeit von KI-Reasoning-Modellen

Eine neue Studie der Arizona State University stellt die Effektivität der Chain-of-Thought-Methode (CoT) in großen Sprachmodellen infrage. Die Forscher zeigen,...
Lesen Sie weiter
11. August 2025

Einsteins Relativitätstheorie: Neue Erkenntnisse schließen alte Lücken

Zwei Wiener Forscher haben eine bedeutende Lücke in der Allgemeinen Relativitätstheorie geschlossen, die seit über 100 Jahren besteht. Clemens Sämann...
Lesen Sie weiter
11. August 2025

Schlafmediziner: Tipps für erholsamen Schlaf bei Hitze

Bei hohen Temperaturen wird das Einschlafen zur Herausforderung. Schlafmediziner Hans-Günter Weeß empfiehlt, Druck abzubauen und entspannt zu bleiben, um besser...
Lesen Sie weiter
10. August 2025

Volkswagen und Bosch: Autonomes Fahren für alle

Volkswagen und Bosch kündigen an, bis 2026 eine kostengünstige autonome Fahrsoftware für Privatfahrzeuge zu entwickeln. Diese Initiative zielt darauf ab,...
Lesen Sie weiter
1 4 5 6 7 8 33

Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

9 + neun =