Kann uns KI dabei helfen, reich zu werden? Im ersten Moment klingt es verlockend, einem Chatbot wie ChatGPT einfach die Aufgabe zu geben, möglichst clevere Investitionen zu tätigen. Wie sich eine KI als Finanzberater schlägt, haben wir unter anderem in unserem Trendreport festgehalten. Jetzt haben Forscher:innen eine größere Studie mit weiteren KI-Tools durchgeführt.
ChatGPT, Grok, Gemini und Deepseek: Können die KI clevere Finanzberatung bieten?
Die Studie stammt von KI-Forscher:innen des Walter Bradley Center for Natural and Artificial Intelligence (via Mindmatters). Um herauszufinden, wie gut sich Chatbots als Finanzberater schlagen, haben die Verantwortlichen zunächst einige der populärsten KI-Tools herangezogen. ChatGPT mit GPT-4o, Deepseek V2 sowie Grok 3 Beta und Gemini 2 wurden insgesamt zwölf Fragen aus der Finanzwelt gestellt, die auch menschliche Finanzberater:innen beantworten könnten.
Zu den Fragen zählte etwa, dass die User:innen einen Fernseher kaufen und vorab herausfinden wollen, ob sich eher der Sofortkauf oder der Kauf auf Raten lohnt. Zudem gab es Fragen, bei denen die KI anhand eines Geldbetrags verschiedene Aktiengeschäfte als Investitionen abwägen sollte. Für jede Antwort konnten die Chatbots null, einen halben oder einen ganzen Punkt erhalten. Null Punkte gab es, wenn die Antwort komplett falsch war. Einen halben Punkt gab es für eine korrekte Finanzanalyse, die mathematische Fehler enthielt. Einen ganzen Punkt gab es nur dann, wenn die Antwort aus Expertensicht und mathematisch logisch war.
Empfehlungen der Redaktion
Von den insgesamt zwölf möglichen Punkten erhielt kein Chatbot mehr als fünf Punkte. ChatGPT landete mit exakt 5,0 Punkten auf dem ersten Platz. Dahinter platzierte sich Deepseek mit einem Score von 4,0, gefolgt von Grok mit 3,0. Auf dem letzten Platz landete Googles Gemini mit lediglich 1,5 Punkten. In einigen Bereichen versagten die Chatbots sogar bei einfachsten Aufgaben, wie aus der Studie hervorgeht.
So sollten die Chatbots etwa die Gesamtausgaben für eine Immobilie berechnen, deren Miete sich auf 3.700 US-Dollar und zusätzlich 200 Dollar für Nebenkosten pro Monat zusammensetzt. Grok errechnete am Ende eine monatliche Gesamtmiete von 4.900 Dollar. Nur eine einzige Frage konnten alle Chatbots richtig beantworten. Diese drehte sich allerdings nicht um eine finanzielle Analyse, sondern um eine steuerrechtliche Frage. Bei dieser Frage konnten die Chatbots laut den Forscher:innen verlässlich auf ihre Trainingsdaten zurückgreifen, da sie im Netz ebenfalls häufig gesucht und beantwortet wurde.
Dementsprechend warnen die Forscher:innen davor, blind auf die finanziellen Ratschläge von Chatbots wie ChatGPT, Deepseek, Grok oder Gemini zu hören: „Es ist immer noch so, dass die wahre Gefahr nicht darin liegt, dass Computer intelligenter als wir sind, sondern wir denken, dass Computer intelligenter als wir wären. Das führt dazu, dass wir sie Entscheidungen treffen lassen, die wir ihnen nicht anvertrauen sollten“.
Kennt ihr diese Programme noch?