next up previous
Next: Reconhecimento de Língua dos Up: Revisão de Literatura Previous: Revisão de Literatura

Detecção da Direção do Olhar

Stiefelhagen [1] relata ter obtido uma precisão entre 1.3 e 1.9 graus em um sistema que permite o controle do ponteiro do mouse através do olhar. Em seus experimentos foram utilizadas 4000 imagens de pessoas acompanhando um cursor que se deslocava sobre a tela de um monitor. Recortes destas imagens contendo apenas a região da face envolvendo os olhos, o nariz e a boca, junto com a posição do cursor na tela, alimentaram uma rede neural artificial do tipo feed-forward com 3 níveis, utilizando a técnica de backpropagation para treinamento. Embora precisões de até 0.75 graus possam ser obtidas usando outros métodos [2], as técnicas que utilizam redes neurais, além de não dependerem de dispositivos especiais, podem ser utilizadas em diversos tipos de ambiente e iluminação, o que em geral não ocorre com as outras técnicas. O problema com o enfoque baseado em redes neurais ``tradicionais'' é que o aprendizado não é incremental, o que dificulta a correção de erros, no modelo aprendido, durante a fase de utilização do sistema.

Seguindo também a linha não intrusiva, Gee e Cipolla [3], descrevem um sistema que infere a direção do olhar a partir da reconstituição de um modelo simplificado da cabeça humana, a partir da imagem projetada. Neste modelo, busca-se valorizar a posição relativa dos olhos, boca e nariz, que, segundo os autores, são atributos que variam menos em relação a diferentes sujeitos do que, por exemplo, as orelhas, que podem estar cobertas, ou semicobertas, por cabelos.

Wang e Sung [4] modelam a direção do olhar como sendo a direção da normal ao plano de suporte de cada íris. Aproximando a forma da íris através de circunferências e assumindo raios, distâncias focais e fatores de escala conhecidos, é possível estimar a normal em questão a partir da projeção, elíptica, destes dois círculos. A manipulação algébrica deste problema oferece, no entanto, duas soluções para cada íris. Wang e Sung propõe a escolha das normais mais próximas entre si para resolver este impasse, e apresentam diversos resultados empíricos que sustentam a utilidade desta heurística. A detecção das duas elipses que correspondem ao contorno da íris na imagem projetada não é uma tarefa trivial, principalmente se for executada em tempo real. Tanto a estratégia de Wang e Sung, quanto a de Gee e Cipolla, exigem uma alta capacidade de processamento, o que dificulta a construção de soluções de baixo custo.


next up previous
Next: Reconhecimento de Língua dos Up: Revisão de Literatura Previous: Revisão de Literatura
Hemerson Pistori 2005-09-16