Modèles prédictifs de l'attention - à quoi servent-ils, quelles sont leurs faiblesses et quelles sont les opportunités qu'ils présentent pour le chercheur comportemental avisé ?
Un autre jour, un autre article faisant état de nouvelles avancées sur la précision prédictive d'un modèle d'IA atterrit dans ma boîte de réception. Celui-ci, appelé Centaur, créé par des chercheurs du Helmholtz Munich, prétend imiter la pensée humaine et prédire la prise de décision avec une "précision frappante"1.
Ce billet n'est pas une revue de ce modèle qui est en effet impressionnant quand on considère les données d'entraînement que l'algorithme utilise : un ensemble de données appelé "Psych-101".Psych-101"qui comprend plus de 10 millions de décisions prises par 60 092 participants à 160 expériences comportementales.
Quiconque a déjà lu une étude de recherche en psychologie sait que la majorité des participants à une étude universitaire sont des étudiants en psychologie ; c'est l'une des critiques habituelles que l'on vous apprend à formuler lorsque vous faites la critique d'un travail dans le cadre d'un diplôme de psychologie.
Pourquoi cela est-il important ?
En clair, et avec la meilleure volonté du monde, les étudiants en psychologie ne sont pas très représentatifs du grand public.2 C'est l'une des raisons pour lesquelles de nombreuses études en laboratoire peinent à être reproduites, même dans des laboratoires différents, et encore moins dans le monde réel. — les résultats de nombreuses études de psychologie sont directement liés aux participants et aux conditions précises utilisées pour les études en question.
Le monde des Etudes Shopper, que ce soit pour les médias, le shopping, l'orientation, la performance humaine ou l'optimisation des applications/interfaces, a inévitablement connu la même montée en popularité des modèles prédictifs d'IA que presque toutes les autres facettes de la vie au cours des 3 années qui ont suivi le lancement de la version 1.0 de ChatGPT dans le monde.En fait, les modèles prédictifs de l'attention existent depuis bien plus longtemps que cela, et en particulier les modèles de saillance visuelle, tels que celui proposé pour la première fois par Itti & Koch3, gagnent en popularité et en nombre depuis 2001.Il est intéressant de noter que ces modèles n'ont jamais été conçus pour prédire les mouvements oculaires, un point sur lequel je reviendrai plus tard, mais ils étaient, et sont toujours, des prédictions de l'allocation probable de l'attention, le plus souvent visualisée dans une carte spatiale qui ressemble beaucoup à une carte thermique d'Eye tracking.
Pour être tout à fait honnête, je dois dire que je n'ai pas été très impressionné par ces premiers modèles, car ils avaient tendance à bien cartographier l'attention involontaire dès les 1 à 2 premières secondes de visionnage, mais échouaient lamentablement à cartographier l'attention volontaire, ou les mouvements oculaires L'attention volontaire, dont nous savons depuis des décennies qu'elle est principalement déterminée par la tâche plutôt que par le stimulus3. Des développements plus récents, notamment l'élargissement des types de données à l'EEG, qui peut fournir des informations plus approfondies sur l'attention que la plupart des méthodes simples de Eye tracking ont permis d'améliorer considérablement les niveaux de sophistication grâce à des algorithmes d'IA qui ont été formés sur des ensembles de données massives utilisant une gamme de marqueurs biométriques et comportementaux.
Après ce préambule un peu long, venons-en à la question principale de ce billet...
Le bon
Tout d'abord, je ne vais pas mettre en avant des modèles ou des algorithmes spécifiques. Dans le cadre de mes recherches pour cet article, j'ai joué avec plusieurs des principaux algos et j'ai parlé avec des représentants de plusieurs acteurs commerciaux clés, alors n'hésitez pas à me contacter directement si vous souhaitez avoir mon avis personnel. Je vais plutôt parler de ce à quoi ils servent généralement.
Comme pour toute intelligence artificielle, la qualité des algorithmes dépend des données sur lesquelles ils sont entraînés. S'il existe des biais dans les données, ceux-ci se refléteront presque certainement dans les résultats de l'algorithme. Il vaut donc la peine de poser cette question à tout fournisseur avant d'investir dans celui-ci.
Cela dit, ces algorithmes sont généralement très performants en matière de prédiction de la "moyenne"En tant que tels, ils sont parfaits pour tester des concepts à un stade précoce et pour servir d'outils. Je pense sincèrement que tous les concepteurs devraient tester leurs concepts à l'aide de ces outils avant de présenter leurs options à un client. Fondamentalement, ils mettent tout le monde sur un pied d'égalité, ce qui signifie que vous pouvez tester vos propres conceptions et celles des autres par rapport à la "connaissances communes"Je n'ai encore jamais vu une prédiction de l'un de ces algorithmes qu'un expert en science de la vision/attention n'aurait pas pu identifier simplement grâce à sa connaissance de la recherche, mais les gens comme moi ne sont pas bon marché et ne sont pas toujours disponibles, ce qui signifie que l'IA offre la possibilité à une start-up de faire des pré-tests de la même manière qu'une grande entreprise de produits de grande consommation pourrait le faire.
Mais il y a un problème...
Le mauvais
...en fait, plusieurs problèmes.
Les modèles d'IA actuels fondent l'ensemble de leurs connaissances sur ce qui est déjà connu, ce qui signifie qu'il est extrêmement peu probable qu'ils fournissent des informations révolutionnaires sur vos conceptions. Ce type d'informations ne provient généralement que de paradigmes de recherche innovants, avec les bons participants et, presque certainement, une composante qualitative ainsi qu'une méthodologie objective telle que l'eye tracking ou même l'EEG.
Le "ce qui est déjà connu"pourrait en fait ne pas correspondre du tout à vos besoins particuliers. N'oubliez pas que les modèles prédictifs de l'attention sont formés à partir des données des participants et que, pour être pertinents pour vous, ces participants doivent correspondre à votre base d'utilisateurs ou à votre public cible. Cela peut être difficile à réaliser si, par exemple, vous lancez une nouvelle marque de produit et que votre question est "comment puis-je augmenter ma base de clients sans aliéner mes clients existants ?"Les questions de ce type nécessitent généralement des tests auprès de groupes spécifiques de participants, généralement appelés cellules dans les études de marché, et la comparaison des résultats. Actuellement, c'est quelque chose que les modèles d'IA ne peuvent tout simplement pas faire, et en fait, vous auriez probablement besoin d'une version entraînée localement de ces modèles en fonction de votre base de clients.
Comme je l'ai mentionné dans l'introduction, les algorithmes d'attention prédictive trouvent leur origine dans les modèles de saillance visuelle, qui étaient très efficaces pour prédire l'attention involontaire –, c'est-à-dire le type d'attention qui est automatiquement attirée par des éléments qui se distinguent ou qui sont remarquables parce qu'ils sont inattendus. Ainsi, l'influence de la luminosité, de la couleur, du mouvement, et même de l'intensité sonore et de la hauteur des sons pour les stimuli audio, était typiquement bien prédite par ces modèles.3 Malheureusement, nombre d'entre eux ont négligé le rôle de l'attention volontaire, qui met un peu plus de temps à se mettre en place, domine généralement l'allocation de l'attention à long terme (c'est-à-dire après environ 2 secondes) et est guidée par des processus cognitifs de haut niveau tels que les objectifs de la tâche, l'intention, la récompense, la préférence et le désir.Bien entendu, ces éléments sont très contextuels en termes de questions de recherche et de participants et peuvent varier avec le temps et l'exposition répétée, ce qui signifie qu'une simple prédiction sans connaissance de la tâche, basée sur un ensemble généralisé de participants, ne vous dira vraiment pas grand-chose !
Enfin, mais surtout, comme je l'ai déjà mentionné, les modèles d'attention prédictive n'ont jamais été conçus pour prédire les mouvements oculaires et, pour être honnête, ils ne le font toujours pas aujourd'hui. Cela signifie que s'il s'agit des mouvements oculaires proprement dits (par exemple, la séquence de fixation, leur durée, les retours aux zones d'intérêt ou les régressions dans le cas du traitement de texte), ces modèles ne seront d'aucune aide, et il vous faudra utiliser un Eye Tracker. Pour beaucoup d'entre vous, ce n'est peut-être pas un problème car c'est le concept d'ordre supérieur de l'attention qui vous intéresse, mais la raison pour laquelle l'eye tracking et l'attention sont souvent utilisés dans la même phrase est que des mesures comme celles que j'ai mentionnées ci-dessus sont souvent essentielles pour comprendre où se situent les problèmes comme l'ambiguïté ou la confusion dans une conception. Dans les études sur les performances humaines, c'est souvent l'utilisation automatisée de mouvements oculaires non conscients qui peut représenter la différence entre un novice et un expert.
Comment pouvez-vous tirer parti de ce que ces algorithmes ont de mieux à offrir pour vous donner un avantage concurrentiel ?
L'opportunité
Comme je l'ai mentionné au début, lorsque j'ai commencé à étudier ces modèles il y a quelques années, ma réponse aurait été "non", mais il s'agit ici de technologie, et elle n'est jamais figée. Certains de ces algorithmes se sont améliorés au point de devenir méconnaissables au cours des cinq dernières années, mais les limites que j'ai mentionnées plus haut s'appliquent encore fréquemment. Dans un nouveau livre coécrit avec Roger Jackson de Shopper Intelligence, intitulé "The Nursery Rhyme Conundrum"4 nous discutons de l'autorité accordée à l'IA en tant qu'outil, et je suis fermement convaincu que nous devons continuer à la considérer comme un simple outil, et non comme une réponse complète. Alors, comment pouvez-vous tirer parti de ce que ces algorithmes ont de mieux à offrir pour vous donner un avantage concurrentiel ?
Les algorithmes existent. Il est impossible d'y échapper, ce qui signifie que n'importe quel concurrent peut les utiliser pour se renseigner sur vos produits. Pourquoi leur donner cet avantage si vous ne l'utilisez pas vous-même ? Voyez comment vos produits se situent par rapport à la concurrence du point de vue de l'"attention générale". — les informations ainsi obtenues peuvent être cruciales, surtout si l'on considère le dynamisme du marché. À CHAQUE FOIS qu'un concurrent modifie la conception d'un produit, vous devez refaire cette comparaison car, en matière d'attention, le succès est très contextuel.
Ne vous arrêtez pas là. L'un des meilleurs moyens de séduire vos clients est de montrer à quel point vous SAVOIR vos clients. Les tests basés sur des participants généraux, et en particulier les modèles formés sur des étudiants en psychologie, ne vous donneront jamais le niveau de compréhension que vous obtiendrez en testant l'attention avec votre base de clients unique. Par exemple, nous savons que la distribution de l'attention peut varier en fonction de l'âge, du sexe et de la nationalité, donc sans ce niveau de segmentation, vous êtes déjà en difficulté. La seule façon de montrer que vous connaissez vos clients est de faire des tests sur vos clients.
Soyez le meilleur. Si vous êtes une marque de luxe, il ne suffit pas d'être générique. Vous devez être différent. Un simple coup d'œil à l'interminable flux de posts LinkedIn montrant des suggestions de refonte d'annonces, d'interfaces et d'emballages basées sur des algorithmes d'IA vous confirmera qu'elles sont EXACTEMENT qu'elles ont été générées par une IA et non par un designer. C'est précisément ce qu'une marque de luxe doit éviter, à moins bien sûr qu'elle n'essaie d'être ironique. De plus en plus, il est suggéré que l'IA peut même agir comme des participants à une étude, mais ces "participants" ne représenteront certainement pas des clients haut de gamme.
L'inattendu est important. Tout le monde aime une bonne carte thermique d'Eye tracking, et ce n'est pas une coïncidence si les algorithmes d'attention prédictive produisent un résultat d'apparence similaire. Je critique depuis longtemps leur utilisation abusive dans l'eye tracking, et je vais donc clairement mettre en évidence un problème clé qu'ils rencontrent ici. Les valeurs aberrantes dans les études d'eye tracking, qui sont généralement exclues des cartes thermiques parce qu'elles peuvent fausser la représentation, sont souvent parmi les plus instructives lorsqu'il s'agit d'obtenir des informations non évidentes. Un exemple classique, que j'ai rencontré au début de mon doctorat, était ce qui semblait être une panne complète de mon système de "détection des préférences inconscientes".détection des préférences inconscientes"qui était censé fournir une conception optimale en sortie. Lorsque je l'ai testé sur mon partenaire, il m'a donné deux dessins tout aussi probables l'un que l'autre, l'un à dominante rouge, l'autre à dominante verte. Il est, bien entendu, daltonien (rouge/vert) et les deux dessins correspondaient donc en fait au même résultat, révélant ainsi un tout nouveau potentiel pour mon algorithme ! Sans les résultats réels de l'Eye tracking d'une personne aberrante, vous ne saurez jamais qu'elle peut exister et, plus important encore, pourquoi elle s'est comportée comme elle l'a fait. S'appuyer entièrement sur un algorithme d'attention prédictive basé sur la population générale élimine tout potentiel d'apprentissage à partir du comportement aberrant, ce qui est particulièrement pertinent pour les projets d'UX et performance humaine performance humaine.
Tout simplement, rien, à l'heure actuelle, ne peut remplacer l'essai de modèles réels avec des personnes réelles effectuant des tâches réelles. Il ne s'agit pas d'intelligence artificielle, mais de réelle réelle.
Références
Binz, M., Akata, E., Bethge, M.et al.Un modèle de base pour prédire et capturer la cognition humaine.Nature(2025).
Hanel, P. H. et Vione, K. C. (2016). Les échantillons d'étudiants fournissent-ils une estimation précise du grand public ? PloS one, 11(12), e0168354.
Itti, L., Koch, C. Modélisation informatique de l'attention visuelle.Nat Rev Neurosci 2, 194–203 (2001).
Jackson, R. et Holmes, T. (2025). The Nursery Rhyme Conundrum. Pantheon Publishers.
Continuer à se renseigner sur les modèles prédictifs de l'IA par rapport à l'eye tracking.
Les limites de l'Eye tracking prédictif dans le shopper marketing
Cet article explore les limites scientifiques des outils d'eye tracking prédictifs et explique pourquoi la combinaison de l'eye tracking réel et de l'analyse psychologique offre des perspectives supérieures pour mesurer les présentoirs en magasin, les emballages et d'autres interventions de marketing d'achat.
Real vs. comportement synthétique : Le point de vue d'un spécialiste des études de marché sur l'intelligence artificielle
L'observation du comportement humain réel apporte des nuances, un contexte et des informations inattendues que les données algorithmiques ne peuvent tout simplement pas reproduire, ce qui nous donne un véritable avantage dans les études de marché et les projets d'ergonomie.
Capturer les données humaines à l'ère de l'IA
La capture de données humaines à l'aide de l'eye tracking à l'ère de l'IA est importante car nous devons creuser en profondeur la façon dont une personne voit la réalité, comment ses esprits conscient et inconscient la créent.
Abonnez-vous à notre blog
Abonnez-vous à nos articles sur la façon dont les gens utilisent l'eye tracking et l'attention computing.