Cómo evaluar la creatividad en estudiantes universitarios (sin caer en la subjetividad)

Tiempo de lectura: 15 minutos · Autores clave: Guilford · Torrance · Alabbasi et al. · Karunarathne & Calma · Xu & Tognolini · Jönsson & Panadero · Keywords: evaluar creatividad en el aula · evaluación creatividad educación superior · rúbrica creatividad · tests pensamiento divergente · TTCT · assessment creatividad · evaluación formativa creatividad · habilidades creativas estudiantes

Existe un problema que casi todo docente universitario que ha intentado trabajar la creatividad en su aula ha encontrado en algún momento: llega el momento de evaluar, y la sensación es de estar en territorio sin mapas. ¿Con qué criterio se pone nota a una idea original? ¿Quién decide qué tan creativo es un trabajo? ¿No es todo esto inevitablemente subjetivo?

Es una preocupación legítima. Y, si se deja sin resolver, tiene consecuencias graves: los docentes evitan evaluar la creatividad explícitamente, los estudiantes reciben retroalimentación vaga sobre sus procesos creativos, y la creatividad termina siendo un objetivo curricular declarado que nunca se mide ni se desarrolla de verdad.

La buena noticia es que la investigación en psicología cognitiva y evaluación educativa lleva décadas trabajando este problema, y ha producido herramientas concretas, validadas y replicables que permiten evaluar la creatividad con rigor — sin que “rigor” signifique reducir la evaluación a una prueba de opción múltiple, y sin que “creatividad” signifique dejar todo a la impresión subjetiva del evaluador.

Este artículo presenta las principales herramientas disponibles, sus fundamentos teóricos, sus limitaciones honestas y las implicaciones concretas para el docente universitario que quiera evaluar la creatividad de sus estudiantes de manera rigurosa y justa.

El problema de fondo: qué significa evaluar la creatividad

Antes de hablar de herramientas, es necesario aclarar qué se está evaluando cuando se evalúa la creatividad. La confusión sobre esto es la fuente principal del malestar docente ante la evaluación creativa.

La investigación psicológica define la creatividad, en términos operacionales, como la producción de ideas, procesos o productos que son simultáneamente novedosos (originales, estadísticamente infrecuentes) y adecuados (útiles, relevantes para un objetivo específico) (Amabile, 2012; Guilford, 1967). Esta definición dual es fundamental: una idea puede ser original pero completamente inútil (no es creativa en sentido pleno), o puede ser útil pero completamente convencional (tampoco es creativa). La creatividad genuina requiere ambas condiciones.

Esta definición operacional tiene una implicación directa para la evaluación: evaluar la creatividad no es lo mismo que evaluar el “gusto” del evaluador. Es posible construir criterios explícitos para determinar si un producto, proceso o idea cumple con las condiciones de novedad y adecuación en un contexto dado. Esos criterios son, por definición, enseñables y evaluables.

Karunarathne y Calma (2024), en un estudio publicado en Studies in Higher Education (University of Melbourne, DOI: 10.1080/03075079.2023.2225532), señalan el estado actual del problema con claridad:

“The importance of creativity for survival in modern society is well recognised. However, the development of creative thinking skills through formal education still needs more attention, and the assessment of creative thinking skills using valid models in higher education is under-researched.”

Que la evaluación de la creatividad en educación superior esté sub-investigada no significa que no existan herramientas. Significa que los docentes universitarios tienen poco acceso a ellas — y este artículo busca cerrar esa brecha.

Las tres dimensiones que se pueden evaluar

La investigación sobre creatividad identifica tres dimensiones principales que pueden evaluarse de manera diferenciada: el potencial creativo, el proceso creativo y el producto creativo. Comprender la diferencia entre estas tres dimensiones es el primer paso para diseñar una evaluación con sentido.

Dimensión 1 — Potencial creativo

El potencial creativo se refiere a las capacidades cognitivas del estudiante que hacen posible el pensamiento creativo: fluidez, flexibilidad, originalidad y elaboración — las cuatro dimensiones del pensamiento divergente identificadas por Guilford (1967). Evaluar el potencial creativo significa evaluar la capacidad del estudiante para generar ideas originales, no el resultado final de un proyecto específico.

El instrumento más utilizado y validado para evaluar el potencial creativo es el Torrance Tests of Creative Thinking (TTCT), desarrollado por E. Paul Torrance en los años sesenta. Alabbasi, Paek, Kim y Cramond (2022), en una revisión comprehensiva publicada en Frontiers in Psychology (PubMed Central, DOI: 10.3389/fpsyg.2022.1000385), describen el alcance del instrumento:

“This review aims to offer school psychologists and other educators such as teachers, policymakers, and curriculum designers a comprehensive and practical guide to one of the most well-known creativity assessments — the Torrance Tests of Creative Thinking (TTCT) that was developed by E. Paul Torrance in the 1960s. The paper discusses the history, components, training, psychometric properties, and uses of the TTCT. Contrary to the notion that the TTCT is only a measure of divergent thinking skills, the current article presents its other uses.”

Los mismos autores verifican la solidez del instrumento: el TTCT ha demostrado alta fiabilidad y validez durante seis décadas, con validación en más de 2.000 estudios en todo el mundo, en 35 idiomas, incluyendo validaciones en español (Krumm et al., 2016).

Sin embargo, el TTCT tiene limitaciones importantes que el docente universitario debe conocer. Como señala Xu y Tognolini (2022), en un artículo accedido directamente desde las actas de la conferencia HEAd’22 de la Universitat Politècnica de València, los tests psicométricos de creatividad — incluyendo el TTCT — “are based on a norm-referenced assessment and can only provide minimal information about what students know and can do in relation to creativity.” En otras palabras: el TTCT mide el potencial creativo en condiciones artificiales y comparando al estudiante con su cohorte, pero no proporciona información sobre cómo ese potencial se despliega en tareas reales del dominio disciplinar.

Para el docente universitario, el TTCT puede ser una herramienta útil de diagnóstico al inicio de un curso — para conocer el perfil de pensamiento divergente de sus estudiantes — pero no es el instrumento más adecuado para la evaluación formativa o sumativa del aprendizaje creativo en la asignatura.

Dimensión 2 — Proceso creativo

El proceso creativo se refiere a cómo el estudiante trabaja: cómo formula el problema, cómo genera y selecciona ideas, cómo prototipa y refina su solución, cómo aprende del error. Evaluar el proceso significa observar y documentar el recorrido, no solo el destino.

Esta dimensión es especialmente relevante en la educación superior porque refleja directamente las competencias que se quiere desarrollar: pensamiento divergente, tolerancia a la ambigüedad, capacidad de reformular problemas, disposición a iterar. Un estudiante puede producir un resultado final mediocre por razones externas (limitaciones de tiempo, recursos, información) pero haber desplegado un proceso creativo de alta calidad. Evaluar solo el producto final invisibiliza ese proceso.

Las herramientas más adecuadas para evaluar el proceso creativo son los portafolios (colecciones documentadas del proceso de trabajo a lo largo del tiempo), los diarios de proceso (registros del estudiante sobre sus decisiones, exploraciones y aprendizajes), y las rúbricas de proceso que detallan criterios específicos para cada etapa del proceso creativo.

Xu y Tognolini (2022) son explícitos en señalar la limitación de los enfoques actuales: “the priority of representing and measuring student creativity will be given to the creative process and the creative outcome.” La necesidad de evaluar el proceso — y no solo el resultado — es uno de los consensos más sólidos en la investigación sobre evaluación de la creatividad en educación superior.

Dimensión 3 — Producto creativo

El producto creativo es el resultado tangible del proceso: el trabajo escrito, el prototipo, el diseño, el proyecto, la solución. Es la dimensión que más habitualmente se evalúa en las aulas universitarias, pero también la que más frecuentemente se evalúa sin criterios explícitos para la creatividad — limitándose a criterios técnicos o de contenido.

Evaluar la dimensión creativa de un producto requiere criterios específicos orientados a la novedad y la adecuación. Karunarathne y Calma (2024) utilizaron en su investigación tres dimensiones tomadas del marco PISA para evaluar la creatividad: expresión creativa, creación de conocimiento y resolución creativa de problemas — un modelo que ofrece una estructura transdiciplinar aplicable a distintos dominios del conocimiento universitario.

Las rúbricas analíticas: la herramienta más accesible para el docente

Para la mayoría de los docentes universitarios, la herramienta más práctica para evaluar la creatividad sin caer en la subjetividad es la rúbrica analítica bien diseñada.

Una rúbrica analítica descompone la creatividad en dimensiones evaluables por separado y define descriptores para distintos niveles de desempeño en cada dimensión. No elimina el juicio del evaluador — ninguna herramienta puede hacerlo — pero lo estructura, lo hace explícito y lo hace comunicable a los estudiantes antes de que produzcan su trabajo.

Jönsson y Panadero (2017), en su trabajo sobre el diseño y uso de rúbricas para la evaluación del aprendizaje, verificado desde Scaling up Assessment for Learning in Higher Education (Springer), concluyen que la evaluación fiable de las competencias complejas puede mejorarse con el uso de rúbricas, especialmente si son analíticas, específicas al dominio y complementadas con ejemplos (exemplars) y entrenamiento de evaluadores. Este hallazgo tiene una implicación directa: una rúbrica genérica de creatividad — que sirva igual para diseño, escritura, ingeniería y trabajo social — tendrá menor fiabilidad que una rúbrica específica diseñada para el dominio y la tarea concreta.

Para el docente universitario que quiera diseñar su propia rúbrica de creatividad, Xu y Tognolini (2022) proponen un proceso de tres pasos basado en el modelo de evaluación referenciado por estándares (standards-referenced model):

Paso 1 — Definir claramente el constructo: antes de diseñar la rúbrica, es necesario definir qué se entiende por creatividad en el contexto específico de la asignatura. ¿Se evalúa la originalidad de las ideas generadas? ¿La calidad del proceso de reformulación del problema? ¿La adecuación de las soluciones al contexto real? La definición orienta todo lo demás.

Paso 2 — Identificar las dimensiones evaluables: a partir de la definición, se identifican las variables de progreso — las dimensiones específicas que se evaluarán. Para una asignatura centrada en pensamiento creativo, estas podrían incluir: originalidad de las ideas (novedad estadística respecto al dominio), adecuación al objetivo (utilidad en el contexto dado), elaboración (nivel de desarrollo y detalle), y flexibilidad (variedad de perspectivas exploradas).

Paso 3 — Describir los niveles de desempeño: para cada dimensión, se redactan descriptores para distintos niveles — desde el desempeño inicial hasta el avanzado. Los descriptores deben ser suficientemente específicos para que distintos evaluadores lleguen a la misma calificación ante el mismo trabajo, pero suficientemente amplios para no excluir expresiones creativas inesperadas.

La Técnica de Evaluación Consensuada (CAT): cuando se necesita rigor en la evaluación de productos

Para contextos donde la evaluación del producto creativo requiere mayor rigor — trabajos finales, proyectos de grado, presentaciones evaluadas por jurado — la herramienta más validada es la Consensual Assessment Technique (CAT), desarrollada originalmente por Amabile (1982).

La CAT se basa en un principio conceptualmente sólido: la creatividad de un producto puede estimarse de manera fiable mediante el juicio independiente de múltiples expertos en el dominio, sin que estos necesiten llegar a un acuerdo previo sobre los criterios. Los expertos evalúan el nivel de creatividad del producto de manera holística (frecuentemente en una escala de 1 a 7), y el promedio de sus evaluaciones independientes produce una puntuación suficientemente fiable.

Lo que hace de la CAT una herramienta especialmente valiosa para la evaluación universitaria es que no requiere que la creatividad se reduzca a una lista de criterios preestablecidos. Los expertos del dominio — sean docentes, profesionales o académicos — tienen juicio experto sobre qué es original y adecuado en su campo, y ese juicio colectivo, cuando se sistematiza correctamente, produce evaluaciones con alta consistencia inter-evaluador.

Las limitaciones de la CAT son igualmente importantes. Primero: requiere múltiples evaluadores con experiencia en el dominio, lo que es costoso en tiempo y recursos. Segundo: no proporciona retroalimentación específica al estudiante sobre qué aspectos de su trabajo son más o menos creativos — dice cuánto, pero no qué ni por qué. Tercero: es menos adecuada para la evaluación formativa (durante el proceso de aprendizaje) y más adecuada para la evaluación sumativa de productos terminados.

El modelo PISA como marco transdiciplinar

Para los docentes que buscan un marco de evaluación de la creatividad aplicable a múltiples disciplinas, el modelo desarrollado por la OCDE para la evaluación de la creatividad en PISA ofrece una estructura de tres dimensiones que ha sido validada en contextos educativos reales.

Karunarathne y Calma (2024) utilizaron este modelo en su investigación con 150 estudiantes universitarios de primer año de economía y negocios en la Universidad de Melbourne, estructurando la evaluación en tres grandes ejes:

Expresión creativa (creative expression): la capacidad de expresar ideas propias de manera original en un formato dado — un texto, un visual, una propuesta. Se evalúa la originalidad de la expresión y la autonomía respecto a los modelos convencionales del dominio.

Creación de conocimiento (knowledge creation): la capacidad de generar nuevo conocimiento o perspectivas originales a partir de la información existente. Se evalúa la capacidad de síntesis innovadora, de conexión entre dominios y de generación de hipótesis o perspectivas no convencionales.

Resolución creativa de problemas (creative problem solving): la capacidad de identificar y formular problemas de manera original y de generar soluciones novelas y adecuadas. Es la dimensión que conecta más directamente con los modelos CPS revisados en artículos anteriores de esta serie.

Los hallazgos de Karunarathne y Calma son especialmente útiles para el diseño pedagógico: identificaron que los estudiantes de primer año tenían déficits específicos en expresión creativa y resolución creativa de problemas, y que la tarea de evaluación auténtica diseñada para el estudio produjo mejoras medibles en ambas dimensiones a lo largo del semestre. Esto confirma que la evaluación bien diseñada no es solo una herramienta de medición: es en sí misma una intervención pedagógica que desarrolla la creatividad.

Cinco errores frecuentes en la evaluación de la creatividad universitaria

La investigación sobre evaluación creativa en educación superior permite identificar cinco errores que los docentes cometen con mayor frecuencia.

Error 1 — Evaluar solo el producto final, ignorando el proceso

Un producto final mediocre puede ser el resultado de un proceso creativo de alta calidad interrumpido por circunstancias externas. Un producto final brillante puede ser el resultado de un proceso convencional bien ejecutado. Evaluar exclusivamente el producto final ofrece una imagen incompleta y frecuentemente injusta de las capacidades creativas del estudiante.

Error 2 — Usar la misma rúbrica para evaluar creatividad que para evaluar calidad técnica

Originalidad y calidad técnica son criterios distintos y no necesariamente correlacionados. Un trabajo puede ser técnicamente impecable y completamente convencional. Un trabajo puede ser altamente original y técnicamente imperfecto. Una rúbrica que mezcla ambos criterios sin distinguirlos produce evaluaciones que no miden la creatividad de manera diferenciada.

Error 3 — Penalizar la originalidad que no coincide con las expectativas del docente

Uno de los hallazgos más consistentes de la investigación sobre evaluación de la creatividad es que los evaluadores tienden a preferir las ideas que confirman sus supuestos previos sobre lo que es una “buena solución”. Este sesgo — que Jönsson y Panadero (2017) identifican como uno de los principales riesgos de la evaluación sin rúbrica — puede hacer que la evaluación “creativa” termine recompensando la conformidad con las expectativas del docente en lugar de la originalidad genuina.

Error 4 — No comunicar los criterios de evaluación a los estudiantes antes del trabajo

Si los estudiantes no saben con qué criterios se evaluará la creatividad de su trabajo antes de producirlo, no pueden orientar sus esfuerzos de manera informada. Peor aún: pueden interpretar la ausencia de criterios explícitos como una señal de que lo que importa es “impresionar” al docente, lo que genera producción estéticamente elaborada pero no necesariamente original. Los criterios explícitos antes del trabajo son una condición necesaria para la evaluación justa de la creatividad.

Error 5 — Evaluar la creatividad con un único evaluador sin calibración previa

La fiabilidad de las evaluaciones de creatividad mejora significativamente cuando múltiples evaluadores evalúan de manera independiente antes de comparar resultados, cuando los evaluadores se entrenan con ejemplos del nivel esperado (exemplars), y cuando existe un proceso de discusión y calibración entre evaluadores. Evaluar la creatividad en solitario, sin ninguno de estos procesos, produce evaluaciones más susceptibles al sesgo individual del evaluador.

Una propuesta de rúbrica mínima para el aula universitaria

A partir de la evidencia revisada, es posible proponer una estructura mínima de rúbrica para evaluar la creatividad en trabajos universitarios de distintas disciplinas. Esta propuesta integra las dimensiones de Guilford (1967), el marco PISA utilizado por Karunarathne y Calma (2024) y los principios de diseño de rúbricas de Xu y Tognolini (2022).

Dimensión 1 — Originalidad: ¿En qué medida la idea, solución o perspectiva presentada difiere de las respuestas convencionales del dominio? Nivel básico: reproduce perspectivas estándar sin modificación. Nivel intermedio: introduce variaciones sobre perspectivas existentes. Nivel avanzado: propone perspectivas genuinamente nuevas para el dominio o el contexto.

Dimensión 2 — Adecuación: ¿En qué medida la idea o solución responde de manera pertinente al problema o desafío planteado? Nivel básico: la solución es tangencial o parcialmente relevante. Nivel intermedio: la solución es pertinente pero con limitaciones importantes. Nivel avanzado: la solución responde de manera directa y eficaz al desafío planteado.

Dimensión 3 — Elaboración: ¿En qué medida la idea o solución está desarrollada, especificada y argumentada? Nivel básico: la idea está esbozada sin desarrollo. Nivel intermedio: la idea está desarrollada con algunos argumentos o detalles. Nivel avanzado: la idea está plenamente desarrollada, especificada y fundamentada con evidencia o razonamiento.

Dimensión 4 — Proceso (cuando se evalúa): ¿En qué medida el proceso documentado muestra exploración de múltiples alternativas, reformulación del problema y aprendizaje de los errores? Nivel básico: el proceso muestra una única línea de desarrollo sin exploración de alternativas. Nivel intermedio: el proceso muestra exploración de algunas alternativas con criterios implícitos de selección. Nivel avanzado: el proceso muestra exploración amplia, reformulación explícita del problema y criterios claros de selección basados en la retroalimentación recibida.

Esta estructura debe adaptarse al dominio específico y a la tarea concreta, incorporando exemplars — ejemplos de trabajos en cada nivel — para calibrar el juicio del evaluador y comunicarlo con claridad a los estudiantes.

La evaluación formativa como desarrollo creativo

Una de las conclusiones más importantes de la investigación revisada es que la evaluación bien diseñada no es solo una medición del nivel creativo de los estudiantes: es en sí misma una intervención que desarrolla su creatividad.

Karunarathne y Calma (2024) lo documentan en su estudio: los estudiantes que participaron en la tarea de evaluación auténtica diseñada para medir las tres dimensiones del marco PISA mostraron mejoras medibles en pensamiento creativo a lo largo del semestre. La estructura de la tarea — que exigía expresión creativa, creación de conocimiento y resolución creativa de problemas — actuó como andamiaje (scaffolding) para el desarrollo de esas competencias.

Esto tiene una implicación pedagógica directa: diseñar la evaluación de la creatividad con criterios claros y compartidos no solo permite medir mejor — también enseña a los estudiantes qué significa pensar creativamente en el contexto de su disciplina. La rúbrica, en este sentido, no es solo una herramienta de calificación: es un mapa del territorio creativo que el estudiante está aprendiendo a navegar.

Conclusión: la subjetividad no es inevitable

La evaluación de la creatividad en el aula universitaria no tiene que ser un territorio de subjetividad arbitraria. Los marcos teóricos de Guilford y Torrance, las rúbricas analíticas basadas en estándares, la Técnica de Evaluación Consensuada y el modelo PISA ofrecen herramientas concretas, validadas y aplicables para evaluar la creatividad de manera rigurosa, justa y formativa.

Lo que la investigación muestra con consistencia es que la clave no está en eliminar el juicio del evaluador — eso no es posible ni deseable — sino en estructurarlo mediante criterios explícitos, comunicarlo antes del trabajo, y calibrarlo mediante procesos de formación y ejemplificación. Un docente que hace esto está evaluando la creatividad de sus estudiantes con el mismo rigor con que evalúa cualquier otra competencia compleja.

Y está, al mismo tiempo, enseñándoles qué significa crear con intención.

Referencias

Alabbasi, A. M. A., Paek, S. H., Kim, D., & Cramond, B. (2022). What do educators need to know about the Torrance Tests of Creative Thinking: A comprehensive review. Frontiers in Psychology, 13, 1000385. https://doi.org/10.3389/fpsyg.2022.1000385

Amabile, T. M. (2012). Componential theory of creativity (Working Paper No. 12-096). Harvard Business School. https://www.hbs.edu/faculty/Pages/item.aspx?num=42469

Guilford, J. P. (1967). The nature of human intelligence. McGraw-Hill.

Jönsson, A., & Panadero, E. (2017). The use and design of rubrics to support assessment for learning. In D. Carless, S. M. Bridges, C. K. Y. Chan, & R. Glofcheski (Eds.), Scaling up assessment for learning in higher education (Vol. 5, pp. 99–111). Springer.

Karunarathne, W., & Calma, A. (2024). Assessing creative thinking skills in higher education: Deficits and improvements. Studies in Higher Education, 49(1), 157–177. https://doi.org/10.1080/03075079.2023.2225532

Xu, W., & Tognolini, J. (2022). Build an assessment rubric of student creativity in higher education. In 8th International Conference on Higher Education Advances (HEAd’22). Universitat Politècnica de València. https://doi.org/10.4995/HEAd22.2022.14695