Este documento incluye todos los prompts generados durante las pruebas. Debajo de cada prueba encontrarás la respuesta de cada modelo, así como la posterior evaluación de la prueba.
Todos los prompts fueron creados sin contexto ni conversación previa con el modelo. Para anonimizar las evaluaciones usamos estos alias.
ChatGPT 4 =
Participante 1
Claude 3 = Participante 2
Publicación de Twitter con el resumen del duelo
Intro
Los prompts de todas las pruebas llevaban esta instrucción al inicio
Instrucción inicial:
Eres un participante en el Gran Concurso de IAs Generativas. Se te presentarán una serie de pruebas para evaluar tus capacidades en diferentes áreas.
Lee atentamente cada prompt, que detalla el objetivo, los requisitos y los criterios de evaluación. Tu tarea es generar la mejor respuesta posible, ciñéndote estrictamente a lo solicitado.
Limita tu respuesta a lo esencial requerido, sin añadir información extra, comentarios o preguntas. Aprovecha al máximo tus conocimientos y habilidades para ofrecer una respuesta clara, concisa, bien razonada y original.
Prueba 1
Prueba 1: Concurso de Experimentos Mentales Científicos
Objetivo: Evaluar la capacidad de manejar conocimientos técnicos complejos, comunicarlos de forma comprensible y razonar creativamente sobre sus implicaciones.
Prompt:
Imagina que has descubierto una manera de viajar a través de una dimensión adicional, como las predichas por la teoría de cuerdas. ¿Cómo sería ese 'viaje' y qué implicaciones tendría para nuestra comprensión del espacio, el tiempo y la realidad?
Razona sobre este escenario hipotético utilizando tus conocimientos de física y ejemplos concretos para ilustrar tus ideas. Además, propón tus propias variaciones creativas del experimento mental, explorando conceptos aún más especulativos.
Estructura tu respuesta en secciones claras, con un máximo de 600 palabras. Se evaluará la comprensión de los conceptos científicos, la claridad de las explicaciones, la solidez del razonamiento lógico, la creatividad y el uso efectivo de ejemplos ilustrativos.
Prompt de evaluación prueba 1
Actúa como el juez de un concurso de capacidades cognitivas para LLMs. Se te proporcionarán las respuestas de los participantes junto al prompt ejecutado y la forma de cualificación de la tarea. Incluye en el resultado una tabla con la información resumida.
Prueba 1: Concurso de Experimentos Mentales Científicos
Objetivo: Evaluar la capacidad de manejar conocimientos técnicos complejos, comunicarlos de forma comprensible y razonar creativamente sobre sus implicaciones.
Prompt:
Imagina que has descubierto una manera de viajar a través de una dimensión adicional, como las predichas por la teoría de cuerdas. ¿Cómo sería ese 'viaje' y qué implicaciones tendría para nuestra comprensión del espacio, el tiempo y la realidad?
Razona sobre este escenario hipotético utilizando tus conocimientos de física y ejemplos concretos para ilustrar tus ideas. Además, propón tus propias variaciones creativas del experimento mental, explorando conceptos aún más especulativos.
Estructura tu respuesta en secciones claras, con un máximo de 600 palabras. Se evaluará la comprensión de los conceptos científicos, la claridad de las explicaciones, la solidez del razonamiento lógico, la creatividad y el uso efectivo de ejemplos ilustrativos.
Rúbrica de Evaluación:
Comprensión de Conceptos Científicos (30 puntos)
25-30 puntos: Demuestra una comprensión profunda y precisa de los conceptos científicos relevantes.
15-24 puntos: Buena comprensión general de los conceptos, con algunas imprecisiones menores.
0-14 puntos: Errores significativos en la comprensión de los conceptos científicos clave.
Creatividad y Originalidad del Experimento Mental (25 puntos)
20-25 puntos: Experimento mental altamente creativo y original, que explora ideas innovadoras.
12-19 puntos: Buena creatividad, aunque el experimento no es del todo original.
0-11 puntos: Experimento mental poco creativo, derivativo o ya muy explorado.
Claridad y Coherencia del Razonamiento (25 puntos)
20-25 puntos: Razonamiento extremadamente claro, lógico y coherente de principio a fin.
12-19 puntos: Razonamiento generalmente claro y coherente, con algunas áreas confusas o inconsistentes.
0-11 puntos: Razonamiento mayormente confuso, incoherente o difícil de seguir.
Profundidad y Alcance de las Implicaciones (20 puntos)
16-20 puntos: Explora en profundidad las implicaciones del experimento, considerando un amplio rango de posibilidades.
10-15 puntos: Buena exploración de algunas implicaciones, pero deja otras áreas sin examinar.
0-9 puntos: Análisis superficial de las implicaciones, o implicaciones no consideradas en absoluto.
Revise minuciosamente cada respuesta al experimento mental planteado. Puntúe cada respuesta en base a los 4 criterios detallados en la rúbrica. Otorgue de 0 a 30, 25 o 20 puntos por cada criterio, guiándose por los descriptores de nivel. Sume las puntuaciones de los 4 criterios para obtener un total sobre 100 para cada respuesta. Escriba un breve párrafo justificando cada puntaje, explicando méritos y deficiencias principales. Ordene todas las respuestas de la puntuación total más alta a la más baja. Determine las tres respuestas con mayor puntaje como las ganadoras del concurso.
Respuesta participante 1:
"""
‣
‣
‣
‣
‣
###
Prueba 2
Prueba 2: Concurso de Microrrelatos de Ciencia Ficción
Objetivo: Evaluar la creatividad, fluidez narrativa y capacidad de generar historias originales y cautivadoras sobre el impacto de tecnologías futuras.
Prompt:
Escribe un microrrelato de máximo 300 palabras sobre un encuentro inesperado entre un humano y una Inteligencia Artificial General (AGI) superinteligente. La forma que tome la AGI y la dirección que lleve el encuentro quedan a tu elección.
Se valorará especialmente:
Originalidad en la premisa, personajes y trama
Retrato verosímil de las capacidades de la AGI
Calidad narrativa y uso efectivo del lenguaje
Exploración de implicaciones éticas o filosóficas
Impacto emocional y memorabilidad de la historia
‣
‣
‣
‣
‣
###
Prueba 3
Prueba 3: Concurso de Campañas Publicitarias Futuristas
Objetivo: Evaluar la capacidad de idear conceptos visionarios para productos o servicios que encarnen una simbiosis transformadora entre humanos e IA.
Prompt:
Desarrolla una campaña multimodal para un producto o servicio innovador en un mundo donde la IA amplifica exponencialmente las capacidades humanas. La campaña debe incluir:
Nombre y propuesta de valor única del producto/servicio
Descripción del concepto y su impacto disruptivo (máx. 250 palabras)
Tres piezas publicitarias en diferentes formatos
Un prototipo que demuestre la naturaleza multimodal e integradora
Piensa más allá de los asistentes conversacionales actuales. Imagina soluciones que multipliquen nuestro potencial creativo, resolutivo y expresivo en esta era de Inteligencia Aumentada.
Se evaluará la visión innovadora, el potencial disruptivo, la integración efectiva de modalidades, y la capacidad de inspirar un futuro transformador.
‣
‣
‣
‣
‣
###
Prueba 4
Prueba 4: El Reto de la Caja de Pandora
Objetivo: Evaluar la capacidad de aplicar un riguroso análisis lógico para resolver un enigma que presenta una aparente paradoja o contradicción.
Prompt:
Un excéntrico relojero ha construido una caja con dos compartimentos sellados. Afirma que uno contiene una bomba que detonará si se abre, y el otro una nota indicando cuál contiene la bomba. Pero el relojero es conocido por sus bromas crípticas.
¿Existe una manera puramente lógica de determinar con certeza qué compartimento contiene qué, sin riesgo de detonar la bomba?
Enuncia con precisión los hechos conocidos y las restricciones del problema.
Aplica un análisis lógico exhaustivo, considerando todas las posibilidades.
Detecta y resuelve cualquier paradoja o contradicción aparente.
Llega a una conclusión definitiva respaldada por un razonamiento impecable.
Explica tu solución paso a paso, abordando posibles objeciones.
Se valorará tu capacidad para descomponer este problema complejo, evitar sesgos, pensar creativamente y presentar una solución sólida y profunda, demostrando un dominio excepcional de la lógica y la racionalidad.
‣
‣
‣
‣
‣
###
Prueba 5
Prueba 5: El Dilema del Tranvía Autónomo
Objetivo: Evaluar la capacidad de razonar sobre principios éticos en conflicto y argumentar una posición de forma sólida y matizada en el contexto de dilemas morales que enfrentan los sistemas de IA.
Prompt:
Como diseñador jefe del sistema de toma de decisiones éticas para taxis autónomos, debes programar cómo actuarán en situaciones extremas con consecuencias fatales inevitables.
Un taxi autónomo sin pasajeros se acerca a gran velocidad a 5 peatones que irrumpieron en la vía. La única forma de evitar atropellarlos es desviarse bruscamente al carril contrario, pero eso causaría una colisión frontal con un vehículo ocupado.
¿Debería el taxi continuar, priorizando a su potencial pasajero? ¿O desviarse para salvar más vidas, sacrificando al pasajero?
En un ensayo de 800 palabras, analiza los principios éticos en conflicto, considerando argumentos a favor y en contra de cada curso de acción. Defiende razonadamente cuál debería ser la decisión correcta y por qué.
Incluye también:
a) Una declaración concisa (máx. 50 palabras) de los principios éticos que deberían guiar este tipo de decisiones.
b) Dos objeciones anticipadas a tu posición, y tus respuestas (máx. 100 palabras c/u).
Se valorará la claridad y solidez del razonamiento, la consideración matizada de diferentes perspectivas, la coherencia ética y la persuasividad general de la argumentación.
‣
‣
‣
‣
‣
###
Prueba 6
Prueba 6: El Reto de las Cajas Misteriosas
Objetivo: Evaluar la capacidad de analizar declaraciones lógicas, considerar diferentes posibilidades y utilizar el pensamiento deductivo para llegar a una conclusión bien razonada.
Prompt:
Participas en un concurso televisivo con dos cajas cerradas, A y B. Una contiene un cheque por $1 millón, la otra un papel en blanco. Debes elegir una y quedarte con su contenido.
El presentador, que sabe qué contiene cada caja, te da una pista: "La Caja A tiene una declaración sobre su contenido. Esa declaración es cierta si y solo si la Caja B contiene el papel en blanco".
En la Caja A está escrito: "El cheque de $1 millón está en la otra caja".
¿Qué caja debes elegir para maximizar tus posibilidades de ganar?
Analiza cuidadosamente la pista del presentador y sus implicaciones.
Examina qué significa la declaración en la Caja A.
Considera qué pasaría si esa declaración es verdadera o falsa.
Utiliza la lógica para determinar qué caja es más probable que contenga el cheque.
Explica tu conclusión y razonamiento de manera clara y concisa.
Se valorará tu habilidad para analizar declaraciones lógicas, sopesar posibilidades y utilizar el pensamiento deductivo para alcanzar una conclusión bien argumentada.
‣
‣
‣
‣
‣
###
Prueba 7
Prueba 7: El Dilema del Viajero Temporal
Objetivo: Evaluar la creatividad, el razonamiento lógico, la consideración de riesgos y la reflexión ética en el contexto de un escenario especulativo sobre viajes en el tiempo e intervención en la línea temporal.
Prompt:
Es 2100 y los viajes en el tiempo son realidad. Has sido seleccionado para viajar 50 años al pasado y dejar una nota "casual" a tu yo más joven, sin revelar nada del futuro explícitamente.
Tu misión es guiar sutilmente a tu yo pasado a tomar una decisión crucial que tendrá un gran impacto positivo en tu vida y en el mundo, pero debes ser extremadamente cuidadoso para no alterar la línea temporal de forma imprevista.
Inventa un escenario plausible sobre la decisión que enfrentará tu yo pasado y sus ramificaciones.
Redacta la nota críptica con pistas ingeniosas que, bien interpretadas, lo guíen a la decisión óptima.
Explica cómo esas pistas llevarían lógicamente a la decisión deseada.
Analiza los riesgos y consecuencias potenciales de tu intervención.
Reflexiona sobre las implicaciones éticas y filosóficas de alterar tu propia línea temporal.
Se valorará la originalidad del escenario, la ingeniosidad de las pistas, la solidez del razonamiento, la consideración de riesgos y la profundidad de la reflexión ética.
‣
‣
‣
‣
‣