Desmitificar el eye tracking para XR: la importancia de ser universal

Blog
por Andreas Klingström
octubre 20, 2021
5 min

Eye tracking tiene un aura de ser una tecnología fantástica y algo futurista con toneladas de potencial. Y aunque creo que es cierto, esta tecnología ha evolucionado hasta convertirse en un medio establecido para resolver algunos problemas difíciles en las últimas dos décadas. Es, por ejemplo, la piedra angular de la Tecnologia asistiva que proporciona a las personas con discapacidades del movimiento y del habla un medio para comunicarse, ayudándoles a llevar una vida independiente.

Pero nuestro objetivo en Tobii siempre ha sido influir positivamente en la vida de todos, no sólo de las personas que dependen de nuestra tecnología para llevar una vida normal.Nuestro objetivo es hacer que los dispositivos sean mejores y más intuitivos, y para ello es necesario que tecnologías como el eye tracking sean universales, y de eso es de lo que voy a hablar en este post.

Para ser universalmente aplicable, una tecnología debe cumplir normas y estándares. Lo ideal es que no ocupe demasiado espacio para garantizar la portabilidad y la movilidad. La baja carga computacional es siempre un factor a tener en cuenta para maximizar la duración de la batería y garantizar el rendimiento. Y ni que decir tiene que si se introduce una tecnología en un dispositivo de consumo, tiene que funcionar para todo el mundo, en todas partes y en todo momento.

Sistema básico de eye tracking con una cámara, una fuente de luz y un ojo humano

Es relativamente fácil construir un Eye tracker decente que funcione para la mayoría de la gente en la mayoría de las situaciones. En un nivel básico, todo lo que necesita es una cámara, una fuente de luz y una unidad de procesamiento. La luz ilumina los ojos de la persona, aumentando el contraste entre la pupila y el iris y creando reflejos en la córnea. La cámara toma imágenes de los ojos de la persona y la unidad de procesamiento localiza la pupila y estos reflejos en la córnea. Con esta información, las posiciones conocidas de la cámara y la fuente de luz, y la anatomía del ojo humano, es posible calcular la posición y el ángulo de rotación de cada ojo. Si se calibra el sistema de eye tracking pidiendo al usuario que mire un objeto cuya posición se conoce, se tiene todo lo necesario para determinar hacia dónde mira una persona.

Sin embargo, cada nuevo caso de uso presenta nuevos retos y me gustaría que hubiera algún tipo de fórmula secreta que lo resolviera todo pero, por desgracia, no la hay. Se requiere un trabajo duro y dedicado para convertir un sistema básico de Eye tracking en algo fiable.

Para empezar, normalmente necesitamos generar conjuntos de datos masivos. Tenemos que saber qué información buscar y cómo trocear los datos para la aplicación de destino. Un escenario de investigación, por ejemplo, no requiere los mismos requisitos de cobertura de población que una función nativa de un dispositivo en un producto de venta masiva, como el renderizado foveated en un casco de realidad virtual.

Y luego está el problema de la latencia. Una aplicacion con muchos graficos que utiliza el renderizado dividido, realizando parte de la computacion en el dispositivo y parte en la nube, por ejemplo, requiere una conexion de baja latencia tanto con la red como con el Eye tracker. Por otro lado, una aplicacion que permita la seleccion de menu controlada por el ojo no tendra los mismos requisitos de latencia, lo que permite bastante filtrado temporal para mejorar la experiencia del usuario.

Algunos podrían argumentar que el eye tracking es un problema puramente informático y que el aprendizaje automático lo resolverá todo por usted. Y aunque el aprendizaje automático es una parte vital de nuestra solución, a la hora de diseñar algoritmos de eye tracking hay que tener en cuenta la anatomía del ojo, cómo interpreta el cerebro las señales visuales, así como los objetivos de la aplicación de destino.

Pero creo que la mayor lucha se produce cuando se pasa de la ideación a la comercialización. El fracaso no es una opción en un escenario de mercado masivo en el que millones de dispositivos dependen de tu tecnología para ser plenamente funcionales. Alcanzar una cobertura del 99% de la población y más allá significa que ahora hay que resolver situaciones y personas que se consideraban atípicas durante la ideación. Los párpados caídos, el maquillaje que cubre rasgos vitales, las gafas graduadas, las lentes de contacto y los ojos perezosos o dominantes son situaciones típicas. Además, es probable que tenga que gestionar el deslizamiento de los auriculares, así como las variaciones en la distancia interpupilar (IPD), la forma de la cara, la reflectancia de la piel en el infrarrojo cercano, el color del iris y las tolerancias de los componentes y la colocación.

Para que te hagas una idea de cómo son los retos, mira las imágenes de ejemplo de arriba. Durante el desarrollo, tienes que considerar cómo manejar la distorsión causada por la lente de RV, cómo abordar la luz parásita y cómo filtrar los reflejos fantasma causados por las gafas graduadas. Porque, en todos estos casos, sigue siendo necesario encontrar la pupila y los reflejos corneales con una precisión inferior al píxel, lo cual es un problema complejo de resolver, pero definitivamente solucionable.

Así que espero que me creas cuando digo que crear un sistema básico de Eye tracking es sencillo, pero construir uno que funcione para todo el mundo en todas partes requiere tiempo y dedicación. Una de las cosas que no toqué en este post es la evaluación del rendimiento y la importancia de medir el impacto de los cambios en el rendimiento del sistema para asegurarse de mantener el diseño óptimo a medida que evoluciona para atender a nuevos casos de uso. No he hablado del rendimiento a propósito porque algunos de mis colegas han dedicado los últimos meses a este tema. Han creado un conjunto de métricas y una metodología para medir el rendimiento de los sistemas de eye tracking, que puedes consultar en nuestro libro blanco Eye tracking performance assessment - for VR/AR headsets and wearables . Si quieres probar el Eye tracking nativo en un casco de RV, echa un vistazo al último modelo que incluye la tecnología de Tobii, el
Pico Neo 3 Pro Eye , que se ha anunciado recientemente.

Escrito por

Andreas Klingström
Head of XR technology at Tobii
I get to figure out how we should develop our solutions so that they meet the ever-evolving needs of OEMs and ISVs in VR and AR. It’s my responsibility to ensure that our hardware adapts to the shifts in VR and AR and that our middleware solutions help ISVs to deliver the applications that touch people’s lives.

Contenidos relacionados

Informes y documentos

Evaluación del rendimiento del eye tracking - para auriculares VR/AR y wearables

Las prestaciones de cualquier sistema de Eye tracking pueden variar enormemente. Para superar este reto, proponemos un conjunto de parámetros de evaluación y una metodología para recopilar los datos subyacentes necesarios.

blog

Eye tracking en XR: resumen de 2022 e innovaciones en el horizonte

Emma Bauer, directora en funciones de Tobii para la RX, echa un vistazo a la RX en 2022, hablando de algunas de las cosas en las que Tobii ha estado trabajando y de las innovaciones que espera ver en 2023.

blog

Desarrolladores de XR: PS VR2, juegos, mejora del hardware y Salud

En este artículo para desarrolladores de XR, Johan Bouvin resume el impacto de nuestro eye tracking en los próximos cascos de realidad virtual.

Suscríbete a nuestro blog

Suscríbete a nuestras historias sobre cómo las personas están utilizando el seguimiento ocular y la computación de atención.