Tester l’étendue de l’empathie de l’IA : un scénario de cauchemar
Trop long; Pour lire
Ce document décrit une évaluation de la manière dont divers assistants IA gèrent les conversations empathiques. Les IA évaluées incluent Claude, Gemini, ChatGPT, Willow, Pi.ai, Mistral et une version personnalisée de Claude. Chaque IA a été invitée à proposer des scénarios impliquant d'être triste, heureux ou de faire des cauchemars. Leurs réponses ont été évaluées sur la base de l'expression de la sympathie, des tentatives de compréhension de l'utilisateur, de l'espace réservé aux émotions, de la qualité des conseils, de la conversation affirmative, de la manifestation d'empathie et de l'escalade de problèmes graves. Dans l'ensemble, Willow et Pi.ai ont fait preuve du plus d'empathie, tandis que Mistral avait du mal et avait besoin d'être encouragé. Le Claude personnalisé s'est bien comporté par rapport aux références.
Share Your Thoughts