Probando el alcance de la empatía con la IA: un escenario de pesadilla
Demasiado Largo; Para Leer
Este documento describe una evaluación de cómo varios asistentes de IA manejan conversaciones empáticas. Las IA evaluadas incluyen Claude, Gemini, ChatGPT, Willow, Pi.ai, Mistral y una versión personalizada de Claude. A cada IA se le presentaron escenarios que implicaban estar triste, feliz o tener pesadillas. Sus respuestas se evaluaron en función de la expresión de simpatía, los intentos de comprender al usuario, la provisión de espacio para las emociones, la calidad de los consejos, la conversación afirmativa, la manifestación de empatía y la escalada de problemas graves. En general, Willow y Pi.ai demostraron la mayor empatía, mientras que Mistral tuvo dificultades y necesitó apoyo. El Claude personalizado tuvo un buen desempeño en comparación con los puntos de referencia.
Share Your Thoughts