home

IA: ¡Inteligencia real!

  • Blog
  • por Dr. Tim Holmes
  • 6 min

Un día más, llega a mi bandeja de entrada otro artículo que informa de nuevos avances en la precisión predictiva de un modelo de IA. Éste, llamado Centaur y creado por investigadores del Helmholtz de Múnich, afirma imitar el pensamiento humano y predecir la toma de decisiones con una "sorprendente precisión"1.

Este post no es una revisión de ese modelo, que es realmente impresionante si se tienen en cuenta los datos de entrenamiento que utiliza el algoritmo: un conjunto de datos llamado "Psych-101"que incluye más de 10 millones de decisiones tomadas por 60.092 participantes en 160 experimentos conductuales.

Suena muy bien, ¿verdad? Pero aquí es precisamente donde te invito a pararte a reflexionar un momento. Cualquiera que haya leído alguna vez un estudio de investigación en psicología sabrá que la mayoría de los participantes en cualquier estudio académico son estudiantes de psicología, es una de las críticas estándar que te enseñan a mencionar cuando criticas trabajos como parte de la carrera de psicología.

¿Por qué es importante?

Sencillamente, y con la mejor voluntad del mundo, los estudiantes de psicología no son tan representativos del público en general 2 Esta es una de las razones por las que muchos estudios de laboratorio tienen dificultades para reproducirse incluso en diferentes laboratorios, por no hablar del mundo real. los resultados de muchos estudios de psicología están directamente ligados a los participantes y a las condiciones precisas utilizadas para los estudios en cuestión.

El uso del eye tracking en los estudios de psicología ayuda a los investigadores a comprender las preferencias, los prejuicios y los comportamientos de los individuos.
El uso del eye tracking en los estudios de psicología ayuda a los investigadores a comprender las preferencias, los prejuicios y los comportamientos de los individuos.

El mundo de la investigación de la atención, ya sea para los medios de comunicación, los compradores, la orientación, el rendimiento humano o la optimización de aplicaciones/interfaces, ha experimentado inevitablemente el mismo aumento de popularidad de los modelos predictivos de IA que casi todas las demás facetas de la vida en los 3 años transcurridos desde que se lanzó al mundo la versión 1.0 de ChatGPT.De hecho, los modelos de predicción de la atención existen desde hace mucho más tiempo y, en concreto, los modelos de saliencia visual, como el propuesto por primera vez por Itti y Koch3, son cada vez más populares y numerosos desde 2001.Curiosamente, estos modelos nunca pretendieron predecir los movimientos oculares, un punto sobre el que volveré más adelante, pero eran, y siguen siendo, predicciones de la posible asignación de la atención, normalmente visualizadas en un mapa espacial que se parece mucho a un mapa de calor de eye tracking.

Voy a ser totalmente honesto, mi experiencia con muchos de estos primeros modelos me había dejado un poco impresionado, ya que tendían a hacer un gran trabajo de mapeo de la atención involuntaria de los primeros 1-2 segundos de visualización, pero fracasó miserablemente en la cartografía de la atención voluntaria, o sus asociados movimientos oculares Los avances más recientes, como la ampliación de los tipos de datos para incluir el electroencefalograma (EEG), que puede proporcionar información más profunda sobre la atención que la mayoría de las técnicas de Eye tracking han dado lugar a una mejora significativa de los niveles de sofisticación gracias a algoritmos de IA que han sido entrenados en conjuntos de datos masivos utilizando una serie de marcadores biométricos y de comportamiento.

Después de este largo preámbulo, pasemos a la cuestión principal de este artículo...

Modelos predictivos de la atención: ¿para qué sirven, cuáles son sus puntos débiles y qué oportunidades presentan para el investigador experto en comportamiento?

Lo bueno

En primer lugar, no voy a destacar modelos o algoritmos específicos. Como parte de mi investigación para este post, he jugado con muchos de los principales algoritmos y he hablado con representantes de varios actores comerciales clave, así que no dude en ponerse en contacto conmigo directamente si desea conocer mis opiniones personales. En su lugar, voy a discutir para qué son buenos en general.

Como ocurre con toda la Inteligencia Artificial, los algoritmos son tan buenos como los datos con los que se entrenan. Si hay sesgos en los datos, es casi seguro que se reflejarán en los resultados del algoritmo, por lo que merece la pena hacer esta pregunta a cualquier proveedor antes de invertir en él.

Dicho esto, estos algoritmos suelen ser muy buenos prediciendo "atención media"Como tales, son excelentes para utilizarlos en las primeras fases de las pruebas de diseño y como herramientas. Creo sinceramente que todos los diseñadores deberían probar conceptos con ellos antes de presentar opciones a un cliente. Básicamente, nivelan el campo de juego, lo que significa que puedes probar tanto tus propios diseños como los de los demás frente al "conocimiento común"Nunca he visto una predicción de uno de estos algoritmos que un experto en ciencias de la visión/atención no pudiera haber identificado simplemente por su conocimiento de la investigación, pero las personas como yo no son baratas y no siempre están disponibles, lo que significa que la IA ofrece la oportunidad de que una empresa de nueva creación realice pruebas previas de la misma manera que podría hacerlo una gran empresa de bienes de consumo.

Pero aquí hay un problema...

Los modelos de IA no pueden predecir si un cliente elegirá la marca A o la B. Los Eye trackers portatiles ayudan a ver el proceso de elección.
Los modelos de IA no pueden predecir si un cliente elegirá la marca A o la B. Los Eye trackers portatiles ayudan a ver el proceso de elección.

Lo malo

...bueno, en realidad, varios problemas.

  • Los modelos de inteligencia artificial actuales basan todos sus conocimientos en lo que ya se sabe, lo que significa que es muy poco probable que aporten ideas revolucionarias a sus diseños. Este tipo de conocimiento sólo suele proceder de paradigmas de investigación innovadores, con los participantes adecuados y, casi con toda seguridad, algún componente cualitativo, además de una metodología objetiva como el Eye tracking o incluso el EEG.

  • Lo "lo que ya se sabe"Recuerde que los modelos predictivos de atención se entrenan a partir de datos de participantes, por lo que, para que sean relevantes para usted, esos participantes deben coincidir con su base de usuarios o público objetivo. Esto puede ser difícil de lograr si, por ejemplo, está lanzando un cambio de marca de producto y su pregunta es "¿cómo puedo aumentar mi base de clientes sin alejar a ninguno de mis clientes actuales?"Este tipo de preguntas suelen requerir la realización de pruebas con grupos específicos de participantes, denominados células en los estudios de mercado, y la comparación de los resultados. En la actualidad, esto es algo que los modelos de IA no pueden hacer y, de hecho, probablemente se necesitaría una versión entrenada localmente de esos modelos basada en su base de clientes.

  • Como mencioné en la introducción, los algoritmos de predicción de la atención tienen sus raíces en los modelos de Saliencia Visual, que eran muy buenos para predecir la atención involuntaria –, es decir, el tipo de atención que se presta automáticamente a cosas que destacan o son llamativas porque son inesperadas. Así, la influencia del brillo, el color, el movimiento, e incluso el volumen y el tono de los estímulos de audio, fueron normalmente bien predichos por estos modelos...3 Desgraciadamente, muchos de ellos pasaron por alto el papel de la atención voluntaria, que tarda un poco más en activarse, suele dominar la asignación de la atención a largo plazo (es decir, después de unos 2 segundos) y está guiada por procesos cognitivos de alto nivel, como los objetivos de la tarea, la intención, la recompensa, la preferencia y el deseo.Por supuesto, todo esto depende en gran medida de las preguntas de la investigación y de los participantes, y puede variar con el tiempo y la exposición repetida, lo que significa que una simple predicción sin conocimiento de la tarea, basada en un conjunto generalizado de participantes, no le dirá gran cosa.

  • Por último, pero en realidad bastante importante, como he mencionado antes, los modelos predictivos de atención nunca fueron pensados para predecir los movimientos oculares, y para ser honesto, todavía no lo hacen hoy en día. Esto significa que si se trata de los movimientos oculares reales (por ejemplo, la secuencia de fijación, su duración, los retornos a las áreas de interés o regresiones en el caso de procesamiento de texto), estos modelos no van a ayudar, para eso vas a tener que utilizar un Eye tracker. Puede que para muchos de ustedes esto no sea un problema porque lo que les interesa es el concepto de atención de orden superior, pero la razón por la que Eye tracking y atención se utilizan a menudo en la misma frase es que medidas como las que he mencionado anteriormente suelen ser esenciales para entender dónde se encuentran problemas como la ambigüedad o la confusión en un diseño. En los estudios de rendimiento humano, a menudo es el uso automatizado de movimientos oculares no conscientes lo que puede representar la diferencia entre un novato y un experto.

Los modelos predictivos de IA no pueden acceder a lo que ve un experto frente a un novato. Eye tracking puede mostrar con precisión las diferencias.
Los modelos predictivos de IA no pueden acceder a lo que ve un experto frente a un novato. Eye tracking puede mostrar con precisión las diferencias.
¿Cómo puede aprovechar lo mejor de estos algoritmos para obtener una ventaja competitiva?

La oportunidad

Puede que ahora te estés preguntando "¿merece la pena molestarse con estos modelos predictivos de atención?" Como mencioné al principio, cuando empecé a investigar estos modelos hace unos años, mi respuesta habría sido "no", pero estamos hablando de tecnología, y nunca se queda quieta. Algunos de estos algoritmos han mejorado casi hasta volverse irreconocibles en los últimos 5 años, pero las limitaciones que mencioné anteriormente siguen vigentes con frecuencia. En un nuevo libro escrito en coautoría con Roger Jackson, de Shopper Intelligence, titulado "The Nursery Rhyme Conundrum"4 hablamos de la autoridad que se está dando a la IA como herramienta, y creo firmemente que tenemos que seguir viéndola como eso, una herramienta, y no como una respuesta completa. Entonces, ¿cómo se puede aprovechar lo mejor que ofrecen estos algoritmos para tener una ventaja competitiva?

  1. Los algoritmos están ahí fuera. No hay escapatoria, lo que significa que cualquier competidor puede utilizarlos para conocer sus productos. ¿Por qué darles esa ventaja si no vas a utilizarla tú mismo? Comprueba cómo se comparan tus diseños con los de la competencia desde la perspectiva de la "atención general". Los resultados pueden ser cruciales, sobre todo teniendo en cuenta el dinamismo del mercado. CADA VEZ QUE que un competidor cambie el diseño de un producto, debería volver a realizar esta comparación, porque cuando se trata de la atención, el éxito depende en gran medida del contexto.

  2. No se detenga ahí. Una de las mejores formas de atraer a sus clientes es demostrar lo bien que CONOCE a sus clientes. Las pruebas basadas en participantes generales, y especialmente los modelos entrenados con estudiantes de psicología, nunca le proporcionarán el nivel de conocimiento que obtendrá probando la atención con su base única de clientes. Por ejemplo, sabemos que la distribución de la atención puede variar con la edad, el sexo y la nacionalidad, así que sin este nivel de segmentación ya tiene problemas. La única forma de demostrar que conoce a sus clientes es hacer pruebas con ellos.

  3. Sea el mejor. Si eres una marca de lujo, no basta con ser genérico. Tienes que ser diferente. Basta con echar un vistazo al sinfín de publicaciones de LinkedIn que muestran rediseños sugeridos de anuncios, interfaces y paquetes basados en algoritmos de IA para confirmar que parecen EXACTAMENTE como si hubieran sido generados por una IA y no por un diseñador. Esto es precisamente lo que una marca de lujo debe evitar, a menos, claro está, que intente ser irónica. Cada vez más vemos la sugerencia de que la IA puede incluso actuar como participantes en un estudio, pero estos "participantes" ciertamente no representarán a los clientes de gama alta.

  4. Lo inesperado importa. A todo el mundo le gusta un buen mapa de calor de eye tracking, y no es casualidad que los algoritmos de atención predictiva produzcan un resultado de aspecto similar. Llevo mucho tiempo criticando su uso indebido en el Eye tracking, y por eso voy a destacar claramente un problema clave que tienen aquí. Los valores atípicos en los estudios de Eye tracking, que normalmente se excluyen de los mapas de calor porque pueden distorsionar la representación, son con frecuencia algunos de los más informativos cuando se trata de conocimientos no evidentes. Un ejemplo clásico, que me encontré al principio de mi doctorado, fue lo que parecía ser un desglose completo de mi "detección inconsciente de preferencias"que debía dar como resultado un diseño óptimo. Cuando lo probé con mi compañero, me dio dos diseños igualmente probables: uno era mayoritariamente rojo y el otro mayoritariamente verde. Él es, por supuesto, daltónico rojo/verde, por lo que los dos diseños eran en realidad el mismo resultado, ¡lo que revelaba todo un nuevo potencial para mi algoritmo! Sin los resultados reales del Eye tracking de un valor atípico, nunca sabrás si existe y, lo que es más importante, por qué se comporta de esa manera. Confiar por completo en un algoritmo de atención predictiva basado en la población general elimina cualquier posibilidad de aprender del comportamiento atípico, lo que es especialmente relevante para los algoritmos de UX y rendimiento humano humano.

Sencillamente, nada, en estos momentos, puede sustituir a las pruebas de diseños reales con personas reales que realizan tareas reales. No se trata de inteligencia artificial, es real real.

Referencias

  1. Binz, M., Akata, E., Bethge, M.et al.Un modelo básico para predecir y captar la cognición humana.Nature(2025).

  2. Hanel, P. H., y Vione, K. C. (2016). Proporcionan las muestras de estudiantes una estimación precisa del público en general? PloS one, 11(12), e0168354.

  3. Itti, L., Koch, C. Modelización computacional de la atención visual.Nat Rev Neurosci 2, 194–203 (2001).

  4. Jackson, R., y Holmes, T. (2025). The Nursery Rhyme Conundrum. Pantheon Publishers.

Escrito por

  • Dr. Tim Holmes

    Dr. Tim Holmes

    Independent Neuroscientist, Researcher and Educator

    Dr. Tim Holmes is a visual neuroscientist who researches the role that environment and design play in decision making and behavior. He is recognized as a leading authority on eye tracking and visual attention and has worked with top brands, retailers, architects, content creators, and sports teams to educate on, and develop, behavioral interventions. Tim also works with many academic institutions and is an award-winning educator and public speaker on the application of neuroscience to behavioral influence.

Siga aprendiendo sobre los modelos predictivos de IA frente al eye tracking

Swoosh Top

Suscríbete a nuestro blog

Suscríbete a nuestras historias sobre cómo las personas están utilizando el seguimiento ocular y la computación de atención.