Por: Mtro. Rodolfo Guerrero Martínez
La integración de los modelos de lenguaje de gran escala (LLMs) en la práctica jurídica y tecnológica no es una tendencia pasajera, sino un cambio de paradigma. Sin embargo, para los profesionales del derecho, la pregunta no es solo qué pueden hacer estos modelos, sino bajo qué estructuras cognitivas y sesgos operan.
A menudo, caemos en la trampa de la antropomorfización, esperando un razonamiento humano de sistemas que funcionan bajo principios estadísticos radicalmente distintos. Este artículo analiza, desde una perspectiva técnica y crítica, la psique de la IA y las directrices para un uso profesional ético y preciso.
1. LA FALACIA DEL HUMANO UNIVERSAL: ¿A QUIÉN IMITAN LOS LLMS?
Cuando evaluamos el rendimiento de un LLM, solemos compararlo con el desempeño humano. ¿No obstante, surge una pregunta crítica planteada por Atari et al. (2023) en su investigación titulada Which Humans?: ¿a qué humanos nos referimos?
La realidad es que los modelos actuales muestran una psicología WEIRD (por sus siglas en inglés: Occidental, educada, industrializada, rica y democrática), lo que los convierte en un valor atípico en comparación con la diversidad psicológica global.
Como señalan Atari et al. (2023), los LLMs no se parecen a las respuestas humanas en diferentes baterías de pruebas psicométricas. Heredan una psicología WEIRD en muchos aspectos actitudinales. Esta homogeneización es peligrosa en el ámbito legal, donde la interpretación de normas y valores debe ser sensible al contexto cultural.
De tal modo que, el fenómeno de WEIRD in, WEIRD out sugiere que el entrenamiento con datos predominantemente angloparlantes produce resultados que no representan a la mayor parte de la población mundial.
2. EL DESALINEAMIENTO CULTURAL: UN ESTUDIO EMPÍRICO
La investigación intitulada Assessing Cross-Cultural Alignment between ChatGPT and Human Societies: An Empirical Study de Cao et al. (2023) refuerza esta preocupación al utilizar la Encuesta de Cultura de Hofstede para medir el alineamiento, los autores descubrieron que ChatGPT exhibe un alineamiento robusto con la cultura estadounidense, pero se adapta con mucha menos eficacia a otros contextos culturales.
Un hallazgo inquietante es que el uso de prompts en inglés tiende a aplanar las diferencias culturales, sesgando las respuestas hacia los valores americanos. Consecuentemente, Yuan et al. (2024), en su estudio The high dimensional psychological profile and cultural bias of ChatGPT, revelan que, tras medir 84 dimensiones de características psicológicas, ChatGPT muestra un perfil único que difiere de las normas humanas en la mayoría de las dimensiones de representación de alta magnitud.
Aunque el modelo parece femenino en su asertividad y valora la igualdad, su orientación hacia el colectivismo y la evitación de la incertidumbre es distinta a la de cualquier nación específica.
3. EL PODER INVISIBLE: SESGOS EN LOS SYSTEM PROMPTS
Para el sector legal, donde la transparencia es innegociable, la investigación de Neumann et al. (2025), Position is Power: System Prompts as a Mechanism of Bias in LLMs, es reveladora. Los autores explican que los system prompts son directrices predefinidas que guían el comportamiento del modelo, tomando precedencia sobre las entradas del usuario.
La arquitectura de capas de estos modelos crea un horizonte de responsabilidad donde el usuario final desconoce las instrucciones de fondo. También Neumann et al. (2025) afirman categóricamente que la posición de la información demográfica en los system prompts frente a los user prompts conduce a una disparidad en los sesgos de representación.
Esto significa que, si un desarrollador configura el sistema para interactuar con un perfil específico, el modelo puede generar descripciones más negativas o sesgadas sin que el usuario lo detecte, lo que constituye un sesgo de asignación crítico en tareas de distribución de recursos.
4. HUMOR Y CREATIVIDAD: VENTANAS AL SESGO Y LA VIABILIDAD
Incluso las interacciones aparentemente triviales, como pedirle a una IA que sea "graciosa", pueden exponer prejuicios profundos. Saumure et al. (2025), en Humor as a window into generative AI bias, demuestran que cuando ChatGPT actualiza imágenes para hacerlas más divertidas, aumenta la prevalencia de grupos estereotipados no sensibles políticamente (como personas mayores o con sobrepeso), mientras que reduce la de grupos sensibles (raza y género) para evitar críticas de corrección política. Este humor de abajo hacia arriba (punching down) normaliza estereotipos despectivos bajo una fachada de entretenimiento.
Por otro lado, la capacidad creativa del modelo tiene matices, tal como se enmarca en The Crowdless Future: Generative AI and Creative Problem-Solving, donde Boussioux et al. (2024) señalan que, aunque los humanos superan a la IA en novedad bruta, las soluciones generadas por asociaciones humano-IA (HAI) demuestran una mayor viabilidad estratégica y valor financiero/ambiental.
En ese sentido, la IA tiende a buscar soluciones proximales o incrementales, mientras que los humanos son capaces de saltos conceptuales que trascienden los datos de entrenamiento.
5. ESTRATEGIAS DE MITIGACIÓN: HACIA UN USO APROPIADO
Dada esta evidencia, el uso profesional de los LLMs debe alejarse de la dependencia ciega. Qu y Wang (2024), en su artículo Performance and biases of Large Language Models in public opinion simulation, subrayan que las disparidades de rendimiento son significativas entre naciones desarrolladas y en desarrollo, lo que exige diversificar los datos de entrenamiento e integrar consideraciones socioeconómicas para mejorar la fidelidad de las simulaciones.
Una solución técnica prometedora es la propuesta en CultureLLM: Incorporating Cultural Differences into Large Language Models por Li et al. (2024). Este modelo utiliza un método de aumento de datos semánticos para generar datos de entrenamiento culturalmente equivalentes, logrando que modelos de código abierto superen incluso a GPT-4 en tareas específicas de cultura con costos mínimos.
CONCLUSIÓN
Para utilizar los LLMs apropiadamente, es imperativo seguir estos principios:
1) Transparencia de los prompts. Exigir visibilidad sobre los system prompts para identificar sesgos de configuración.
2) Alineamiento cultural activo. No asumir que el modelo es neutral; es necesario emplear técnicas como el prompting antropológico o el uso de idiomas nativos para activar subredes de conocimiento cultural específico.
3) Humano en el bucle (AI-in-the-loop). Utilizar la IA para mejorar la viabilidad de las soluciones, pero confiar en el juicio humano para la innovación radical y la ética.
En última instancia, como advierte la literatura, el fantasma en la máquina tiene un acento americano, resaltando nuestro deber es actuar como auditores constantes de estos sistemas, garantizando que el derecho y la tecnología no se conviertan en herramientas de una hegemonía cultural algorítmica, sino en motores de una justicia globalmente representativa.
REFERENCIAS BIBLIOGRÁFICAS
Atari, M., Xue, M. J., Park, P. S., Blasi, D. E., y Henrich, J. (2023). Which humans? PsyArXiv. https://doi.org/10.31234/osf.io/5b26t
Boussioux, L., et al. (2024). The Crowdless Future? Generative AI and Creative Problem-Solving.
Cao, Y., et al. (2023). Assessing Cross-Cultural Alignment between ChatGPT and Human Societies: An Empirical Study.
Li, C., et al. (2024). CultureLLM: Incorporating Cultural Differences into Large Language Models.
Neumann, A., et al. (2025). Position is Power: System Prompts as a Mechanism of Bias in Large Language Models (LLMs).
Qu, Y., & Wang, J. (2024). Performance and biases of Large Language Models in public opinion simulation.
Saumure, R., et al. (2025). Humor as a window into generative AI bias.
Yuan, H., et al. (2024). The high dimensional psychological profile and cultural bias of ChatGPT.