Open Book

MIGUEL. Análisis tonal a nivel de guión con metodología validada neurocientíficamente.

Este documento explica, paso a paso, cómo se ha medido la proximidad tonal entre MIGUEL y sus comparables a nivel de guión, antes de rodar un solo plano. La metodología está calibrada contra un dataset público de neuroimagen funcional y todas las fuentes son independientemente verificables.

CONTENIDO

Resumen
El problema de comparar películas a nivel de guión
Las tres dimensiones de Lettieri
Pulp Fiction como control científico
Las tres métricas de similitud
Resultados: las cuatro matrices
Interpretación dramatúrgica
Reproducibilidad técnica
Dataset descargable
Bibliografía y fuentes

1. Resumen.

El análisis posiciona a MIGUEL respecto a tres anclas tonales (Memories of Murder, La isla mínima, Pa negre) y un control científico (Pulp Fiction). La proximidad se calcula sobre tres dimensiones emocionales que la neurociencia ha validado como universales: polaridad, complejidad e intensidad (Lettieri et al., Nature Communications, 2019).

RESULTADO CENTRAL

A partir de los cinco guiones, MIGUEL forma un cluster tonal compacto con sus tres anclas (similitud Wasserstein 0,84–0,85) y se separa con claridad del control científico, Pulp Fiction (0,77). El sistema discrimina firmas dramatúrgicas reales, no semejanzas superficiales.

La elección de Pulp Fiction no es estética. Es la única película de las cinco para la que existe respuesta cerebral fMRI medida, registrada en 86 sujetos viéndola completa [1, 2]. Esto la convierte en un control científico singular: el sistema puede calibrarse contra datos fisiológicos públicos.

2. El problema de comparar películas a nivel de guión.

Cuando un productor afirma "mi película tiene el tono de X", normalmente lo dice como impresión sensible: ha visto X, ha leído el guión, intuye la semejanza. Esa intuición tiene valor, pero no es verificable. Un sistema que pretenda medir proximidad tonal entre películas (a nivel de guión, antes de rodar un solo plano) tiene que resolver dos problemas.

PROBLEMA 1. ¿QUÉ MEDIR?

No basta con etiquetar emociones genéricas ("triste", "tenso"). Esas etiquetas dependen del observador. La neurociencia afectiva ha demostrado que tres dimensiones psicológicas explican el 85% de la varianza emocional cuando se observa cine de forma naturalista, y que esas dimensiones predicen actividad cerebral en sujetos independientes.

PROBLEMA 2. ¿CÓMO COMPARAR DOS CURVAS?

Dos películas pueden tener curvas emocionales con la misma forma temporal pero vivir en regiones distintas del espacio afectivo. La correlación clásica (Pearson) es ciega a la magnitud. Hace falta combinarla con una métrica que mida la distribución, no solo la sincronía.

3. Las tres dimensiones de Lettieri.

Lettieri y colaboradores (IMT School for Advanced Studies, Lucca) hicieron el siguiente experimento. Doce sujetos italianos calificaron continuamente su experiencia emocional mientras veían Forrest Gump; en paralelo, catorce sujetos alemanes independientes vieron la misma película dentro de un escáner fMRI. El análisis de componentes principales sobre las puntuaciones italianas reveló tres dimensiones ortogonales que predicen la actividad cerebral en la cohorte alemana [3]. Esta independencia entre la fuente conductual y la predicción neural es lo que valida estas tres dimensiones como universales y no específicas de una película.

POLARIDAD

45%de la varianza

Rango −10 a +10. Valencia emocional pura: cuán negativa o positiva es la experiencia. El polo negativo va de la incomodidad al terror; el positivo, de la calma a la alegría plena.

COMPLEJIDAD

24%de la varianza

Rango −10 a +10. Cuánto procesamiento cognitivo exige la escena. Positiva = ambivalencia, dilema moral, ironía dramática. Negativa = respuesta primitiva pura: miedo visceral, repulsión, huida.

INTENSIDAD

16%de la varianza

Rango 0 a 10. Fuerza absoluta de la experiencia, independiente del signo. Un clímax catártico y un acto de violencia extrema pueden compartir intensidad máxima pese a tener polaridades opuestas.

Estas tres dimensiones se mapean en zonas espacialmente distintas del córtex temporo-parietal derecho, y se organizan como gradientes paralelos, a la manera en que el córtex visual organiza la posición retiniana. Los autores proponen el término emotionotopy para esta organización topográfica de la emoción [3]. Aunque ninguno de los experimentos usó un guión como estímulo, la taxonomía tridimensional resultante es general: cualquier señal emocional variable en el tiempo, incluido el contenido emocional beat a beat de un guión, puede proyectarse sobre estos tres ejes.

4. Pulp Fiction como control científico.

La Naturalistic Neuroimaging Database (NNDb), mantenida por el LAB Lab del University College London, publicó en 2020 un dataset que registra la actividad cerebral fMRI de 86 sujetos mientras ven diez películas comerciales completas (entre 91 y 154 minutos cada una) [1, 2]. Pulp Fiction (Quentin Tarantino, 1994, 148 minutos) es una de esas diez.

Esto convierte a Pulp Fiction en un control singularmente cualificado: es la única película de las cinco analizadas para la que disponemos de respuesta cerebral medida públicamente. Si el sistema discrimina bien, debería separar Pulp Fiction del cluster de MIGUEL y sus anclas, porque estructuralmente es muy distinta: narrativa no lineal, sin eje culpa-redención, violencia y humor entrelazados.

Para reconstruir Pulp Fiction beat por beat se descargó el CSV oficial de NNDb con las 16.155 palabras del filme, cada una con timestamp sub-segundo validado [4]. Las palabras se agruparon en 140 beats temporales por gaps de silencio mayores a 4 segundos (aproximación a cambios de escena). Cada beat conserva su tiempo real de inicio y fin en el metraje, de modo que cada anotación es directamente alineable con la actividad fMRI publicada.

5. Las tres métricas de similitud.

Cada película produce tres curvas (una por dimensión Lettieri) sobre su duración real en segundos. Comparar dos curvas con una sola métrica es insuficiente: cada métrica captura un aspecto distinto de la similitud. El sistema combina tres.

PEARSON

"¿Suben y bajan a la vez?"

Correlación lineal entre dos curvas resampleadas a igual longitud. Mide sincronía de forma temporal. Ciega a la magnitud absoluta: dos curvas en regiones opuestas del espacio emocional pueden correlacionar alto si sus oscilaciones coinciden.

DTW

"¿Los picos están en los mismos minutos?"

Dynamic Time Warping. Alinea ambas curvas con tolerancia a pequeños desplazamientos temporales y mide la distancia mínima resultante. Robusto a curvas de duración distinta. Captura estructura temporal.

WASSERSTEIN

"¿Viven en el mismo barrio emocional?"

Earth Mover's Distance. Mide cuánta "masa" hay que mover para transformar una distribución en otra. Independiente de la forma temporal: captura dónde vive cada curva en el espacio afectivo, no cómo varía en el tiempo.

Las tres métricas se combinan por media geométrica. La elección no es arbitraria: la media geométrica penaliza las disparidades. Una similitud realmente sólida exige puntuación alta en las tres métricas. Una métrica baja arrastra el resultado a la baja: así se evita que un valor extremo en una dimensión compense una debilidad en otra.

Nota técnica. Dentro de cada métrica, las dimensiones Lettieri se ponderan por la varianza que explican en el paper original: polaridad 52,9%, complejidad 28,2%, intensidad 18,8% (proporcional a 45/24/16). Esto refleja la contribución relativa de cada dimensión a la varianza emocional total.

6. Resultados: las cuatro matrices.

A continuación, las cuatro matrices simétricas de similitud entre las cinco películas. Diagonal verde = autoidentidad (1,00). Ámbar = cluster tonal MIGUEL + 3 anclas. Las casillas con Pulp Fiction están sombreadas para señalar el rol de control.

Matriz Pearson (forma temporal)

	Pulp Fiction	Miguel	Memories	La isla mínima	Pa negre
Pulp Fiction	1,00	0,44	0,55	0,45	0,47
Miguel	0,44	1,00	0,53	0,52	0,56
Memories of Murder	0,55	0,53	1,00	0,52	0,55
La isla mínima	0,45	0,52	0,52	1,00	0,66
Pa negre	0,47	0,56	0,55	0,66	1,00

Cinco películas con firmas temporales muy distintas (todas en 0,44–0,66). Pearson confirma que ninguna película "copia" a otra; cada una tiene su propio ritmo emocional. La similitud MIGUEL–Pulp Fiction es la más baja de la matriz (0,44).

Matriz DTW (alineamiento temporal)

	Pulp Fiction	Miguel	Memories	La isla mínima	Pa negre
Pulp Fiction	1,00	0,96	0,94	0,92	0,94
Miguel	0,96	1,00	0,95	0,94	0,94
Memories of Murder	0,94	0,95	1,00	0,98	0,98
La isla mínima	0,92	0,94	0,98	1,00	0,98
Pa negre	0,94	0,94	0,98	0,98	1,00

Las cinco películas tienen estructura de picos similar (todas alineables con DTW > 0,92). Esta métrica es poco discriminativa en este sample porque todas las películas tienen variabilidad similar. DTW aporta robustez pero no separa por sí sola.

Matriz Wasserstein (distribución en el espacio emocional)

	Pulp Fiction	Miguel	Memories	La isla mínima	Pa negre
Pulp Fiction	1,00	0,91	0,79	0,80	0,77
Miguel	0,91	1,00	0,85	0,85	0,84
Memories of Murder	0,79	0,85	1,00	0,94	0,97
La isla mínima	0,80	0,85	0,94	1,00	0,96
Pa negre	0,77	0,84	0,97	0,96	1,00

Aquí emergen dos clusters claros. Memories of Murder + La isla mínima + Pa negre forman un cluster compacto (0,94–0,97). MIGUEL se sitúa en posición de bisagra: comparte rango de intensidad con Pulp Fiction (0,91) y firma emocional cualitativa con las anclas morales (0,84–0,85). Pulp Fiction queda separada del cluster moral (0,77–0,80).

Matriz combinada (media geométrica)

	Pulp Fiction	Miguel	Memories	La isla mínima	Pa negre
Pulp Fiction	1,00	0,73	0,74	0,69	0,70
Miguel	0,73	1,00	0,76	0,75	0,76
Memories of Murder	0,74	0,76	1,00	0,78	0,81
La isla mínima	0,69	0,75	0,78	1,00	0,85
Pa negre	0,70	0,76	0,81	0,85	1,00

La métrica combinada (conservadora) confirma el cluster tonal de MIGUEL con sus anclas y la separación del control. El resultado es estable y no depende de una única métrica.

7. Interpretación dramatúrgica.

Lo que aparece numéricamente coincide con lo que un programador de festival o un comprador con criterio reconocería al ver las cinco películas:

Memories of Murder, La isla mínima y Pa negre forman un cluster orgánico: thrillers morales con cazadores moralmente comprometidos, casos reales, sin redención fácil, registro oscuro sostenido.
MIGUEL pertenece a ese registro (cluster tonal 0,84–0,85) pero amplía el rango emocional: contiene episodios de intensidad y polaridad que se aproximan a las amplitudes de Pulp Fiction. Eso refleja la decisión autoral de abrir el tercer acto a la redención y al realismo mágico mesoamericano sin sacrificar la columna procedural.
Pulp Fiction, deliberadamente elegida como control, queda separada del cluster: estructura no lineal, sin eje culpa-redención, registro de humor entrelazado con violencia.

La posición de bisagra de MIGUEL no es una debilidad: es el activo. Permite proponer un producto que dialoga con tres anclas premiadas (10 Goyas, 9 Goyas, reconocimiento internacional de festivales) sin ser réplica de ninguna.

8. Reproducibilidad técnica.

Modelo de anotación	Claude Sonnet 4.5 (Anthropic). Prompt unificado aplicado idénticamente a las cinco películas. Sanitización de salida para evitar errores de parseo (bloques JSON múltiples, code fences).
Beats por guión	MIGUEL 119 · Pulp Fiction 140 · Memories of Murder 81 · La isla mínima 85 · Pa negre 83. Total: 508 beats anotados.
Duraciones reales	MIGUEL 105 min · Pulp Fiction 148 min (NNDb) · Memories of Murder 131 min (MoMA, Criterion) · La isla mínima 105 min · Pa negre 108 min.
Eje temporal	Tiempo real en segundos, no normalización a 100 puntos. Resolución: 1 punto cada 10 segundos. Construcción de curvas: interpolación lineal entre beats (sin rellenar gaps con ceros).
Métricas	Pearson (con resampling), Dynamic Time Warping con ventana proporcional, Wasserstein-1 sobre las distribuciones. Combinada: media geométrica.
Pesos por dimensión	Polaridad 52,9% · Complejidad 28,2% · Intensidad 18,8%. Proporcional a la varianza explicada reportada en Lettieri 2019.

Reanotar los mismos guiones con un LLM distinto debería producir matrices con la misma topología cualitativa, ya que las dimensiones Lettieri son externas al proceso de anotación y están validadas neurocientíficamente.

9. Dataset descargable.

Todos los archivos están públicamente disponibles en la carpeta data/ del Open Book y pueden descargarse directamente desde el portal del proyecto. No se requiere registro ni credenciales.

Archivo	Contenido
miguel_unified.json	119 beats de MIGUEL anotados con Save the Cat + Lettieri (polaridad, complejidad, intensidad)
pulp_fiction_reannotated.json	140 beats con timestamps reales NNDb · Tarantino, 1994
memories_of_murder_unified.json	81 beats · Bong Joon-ho, 2003
marshland_unified.json	85 beats · La isla mínima (título IMDb US: Marshland) · Alberto Rodríguez, 2014
black_bread_unified.json	83 beats · Pa negre (título IMDb US: Black Bread) · Agustí Villaronga, 2010
matrix_final_pearson.csv	Matriz Pearson 5×5
matrix_final_dtw.csv	Matriz DTW 5×5
matrix_final_wasserstein.csv	Matriz Wasserstein 5×5
matrix_final_combined.csv	Matriz combinada (media geométrica) 5×5
three_metric_comparison.png	Visualización completa de las cuatro matrices

Comparación visual de las cuatro matrices de similitud

Comparación visual de las cuatro métricas. Las dos que más aportan son Pearson (descarta réplicas formales) y Wasserstein (revela los clusters tonales reales). DTW confirma que ninguna película es estructuralmente atípica. La combinada estabiliza el resultado.

Cualquier asesor que revise el proyecto puede auditar el fundamento numérico con estos diez archivos.

10. Bibliografía y fuentes.

Aliko, S., Huang, J., Gheorghiu, F., Meliss, S., & Skipper, J. I. (2020). A Naturalistic Neuroimaging Database for understanding the brain using ecological stimuli. Scientific Data 7(1):347.
DOI: 10.1038/s41597-020-00680-2
Dataset OpenNeuro: 10.18112/openneuro.ds002837.v2.0.0
Portal del proyecto: naturalistic-neuroimaging-database.org
Naturalistic Neuroimaging Database. Movie Annotations. LAB Lab, University College London. Índice de todas las anotaciones de palabras y rostros (CC-BY).
naturalistic-neuroimaging-database.org/annotations
Lettieri, G., Handjaras, G., Ricciardi, E., Leo, A., Papale, P., Betta, M., Pietrini, P., & Cecchetti, L. (2019). Emotionotopy in the human right temporo-parietal cortex. Nature Communications 10:5568.
DOI: 10.1038/s41467-019-13599-z
Datos y código (CC-BY 4.0): osf.io/tzpdf
Pulp Fiction. Word Annotations. CSV oficial con 16.155 palabras del filme y timestamps validados, NNDb.
naturalistic-neuroimaging-database.org/pages/pulp_fiction_words.csv
Lettieri, G., Handjaras, G., Ricciardi, E., Pietrini, P., & Cecchetti, L. (2021). Chronotopic encoding of emotional dimensions in the human brain assessed by fMRI. European Psychiatry 64(S1):S129.
DOI: 10.1192/j.eurpsy.2021.361
Lettieri, G., et al. Anotaciones conductuales italianas del estudio Emotionotopy. Dataset DataLad de anotaciones de emoción percibida sobre Forrest Gump usado en [3].
github.com/psychoinformatics-de/studyforrest-data-perceivedemotions
Mittal, T., Mathur, P., Bera, A., & Manocha, D. (2021). Affect2MM: Affective Analysis of Multimedia Content Using Emotion Causality. CVPR 2021.
arXiv: arxiv.org/abs/2103.06541
Russell, J. A. (1980). A circumplex model of affect. Journal of Personality and Social Psychology 39(6):1161–1178.
DOI: 10.1037/h0077714