Testen des Ausmaßes der KI-Empathie: Ein Albtraumszenario
Zu lang; Lesen
Dieses Dokument beschreibt eine Bewertung, wie verschiedene KI-Assistenten mit einfühlsamen Gesprächen umgehen. Zu den bewerteten KIs gehören Claude, Gemini, ChatGPT, Willow, Pi.ai, Mistral und eine angepasste Version von Claude. Jede KI wurde mit Szenarien konfrontiert, in denen es darum ging, traurig zu sein, glücklich zu sein oder Albträume zu haben. Ihre Antworten wurden anhand von Ausdruck von Mitgefühl, Versuchen, den Benutzer zu verstehen, Raum für Emotionen, Beratungsqualität, positiver Konversation, Manifestation von Empathie und Eskalation ernster Probleme bewertet. Insgesamt zeigten Willow und Pi.ai das meiste Einfühlungsvermögen, während Mistral Schwierigkeiten hatte und Aufmunterung brauchte. Der angepasste Claude schnitt im Vergleich zu den Benchmarks gut ab.
Share Your Thoughts