ChatGPT, Gemini und Grok: Studie zeigt, wie inkompetent die Chatbots bei finanziellen Fragen sind

Kann uns KI dabei helfen, reich zu werden? Im ersten Moment klingt es verlockend, einem Chatbot wie ChatGPT einfach die Aufgabe zu geben, möglichst clevere Investitionen zu tätigen. Wie sich eine KI als Finanzberater schlägt, haben wir unter anderem in unserem Trendreport festgehalten. Jetzt haben Forscher:innen eine größere Studie mit weiteren KI-Tools durchgeführt.

ChatGPT, Grok, Gemini und Deepseek: Können die KI clevere Finanzberatung bieten?

Die Studie stammt von KI-Forscher:innen des Walter Bradley Center for Natural and Artificial Intelligence (via Mindmatters). Um herauszufinden, wie gut sich Chatbots als Finanzberater schlagen, haben die Verantwortlichen zunächst einige der populärsten KI-Tools herangezogen. ChatGPT mit GPT-4o, Deepseek V2 sowie Grok 3 Beta und Gemini 2 wurden insgesamt zwölf Fragen aus der Finanzwelt gestellt, die auch menschliche Finanzberater:innen beantworten könnten.

Zu den Fragen zählte etwa, dass die User:innen einen Fernseher kaufen und vorab herausfinden wollen, ob sich eher der Sofortkauf oder der Kauf auf Raten lohnt. Zudem gab es Fragen, bei denen die KI anhand eines Geldbetrags verschiedene Aktiengeschäfte als Investitionen abwägen sollte. Für jede Antwort konnten die Chatbots null, einen halben oder einen ganzen Punkt erhalten. Null Punkte gab es, wenn die Antwort komplett falsch war. Einen halben Punkt gab es für eine korrekte Finanzanalyse, die mathematische Fehler enthielt. Einen ganzen Punkt gab es nur dann, wenn die Antwort aus Expertensicht und mathematisch logisch war.

Empfehlungen der Redaktion

Von den insgesamt zwölf möglichen Punkten erhielt kein Chatbot mehr als fünf Punkte. ChatGPT landete mit exakt 5,0 Punkten auf dem ersten Platz. Dahinter platzierte sich Deepseek mit einem Score von 4,0, gefolgt von Grok mit 3,0. Auf dem letzten Platz landete Googles Gemini mit lediglich 1,5 Punkten. In einigen Bereichen versagten die Chatbots sogar bei einfachsten Aufgaben, wie aus der Studie hervorgeht.

So sollten die Chatbots etwa die Gesamtausgaben für eine Immobilie berechnen, deren Miete sich auf 3.700 US-Dollar und zusätzlich 200 Dollar für Nebenkosten pro Monat zusammensetzt. Grok errechnete am Ende eine monatliche Gesamtmiete von 4.900 Dollar. Nur eine einzige Frage konnten alle Chatbots richtig beantworten. Diese drehte sich allerdings nicht um eine finanzielle Analyse, sondern um eine steuerrechtliche Frage. Bei dieser Frage konnten die Chatbots laut den Forscher:innen verlässlich auf ihre Trainingsdaten zurückgreifen, da sie im Netz ebenfalls häufig gesucht und beantwortet wurde.

Dementsprechend warnen die Forscher:innen davor, blind auf die finanziellen Ratschläge von Chatbots wie ChatGPT, Deepseek, Grok oder Gemini zu hören: „Es ist immer noch so, dass die wahre Gefahr nicht darin liegt, dass Computer intelligenter als wir sind, sondern wir denken, dass Computer intelligenter als wir wären. Das führt dazu, dass wir sie Entscheidungen treffen lassen, die wir ihnen nicht anvertrauen sollten“.

Kennt ihr diese Programme noch?

Winzip — Software-Nostalgie: Kennt ihr diese Programme noch?

Verpasse keine News zu New Finance 💌

Hinweis zum Newsletter & Datenschutz

Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter?
Jetzt mehr erfahren

Source link

What's Hot

offener Brief eines menschenrechtskämpfenden Anwalts für Frieden und Gerechtigkeit

„Ich bin schwanger“ reicht nicht – Wenn der Mutterschutz an einem Satz scheitert

Homeoffice – darf der Arbeitgeber die Rückkehr ins Büro einfach anordnen?

Bye-bye, „nur Barzahlung“: Das plant die Ampel für dein Portemonnaie

Cold Wallets im Visier von Kriminellen: Krypto-Diebstahl findet vermehrt offline statt

Betrugsfalle Deutschland-Ticket: So erkennst du die Maschen der Kriminellen

In Nashville werden Artefakte von Bob Dylan versteigert

Der Leerverkäufer Nathan Anderson schließt Hindenburg Research

Byd-Aktie Auf Rekordjagd: Neue Technologie und Europa-StrategieBeflügelndenkurs

Uran als großes Spiel aufgrund des Energiebedarfs von AI-geführtem Energy

Peter Thiel: Diesen drei Deutschen gibt der Milliardär Geld fürs Nicht-Studieren

Handelsrepublik: Kunden Melden Probleme bei Steuerklärung

Am beliebtesten