João Maciel: Trabalho Final de Curso
Título Síntese de Retratos Robot (ftp do documento) (versao .dvi)( short version)
Orientadores
Assunto
Pretende-se desenvolver um sistema que sintetize imagens de faces humanas baseando-se em descrições em linguagem natural, com possíveis refinamentos por interacção directa entre o utilizador e a máquina. Sistemas como estes são já utilizados na investigação policial, apesar de construírem apenas um esboço a partir de colagem de elementos padrão (olhos, narizes ...), pelo que resultam imagens desprovidas de realismo.
A elaboração deste sistema serve também
de pretexto para o estudo dos fundamentos matemáticos da abordagem
utilizada, que serão aplicáveis a muitos outros problemas.
Esta abordagem consiste na representação das imagens como
ponto num espaço multidimensional (dimensão igual ao número
de pixels). Reunindo-se um número
elevado de exemplos de faces humanas, consegue-se uma amostragem do
sub-espaço das imagens que representam caras, que é muito
irregular. A pesquisa tem sido feita no sentido de encontrar uma representação
eficiente deste sub-espaço, que permita interpolar imagens entre
diferentes exemplos, passando sempre por imagens pertencentes a mesma classe
(morphing), recorrendo ao número mais reduzido possível de
parâmetros:
Além disso pretende-se também identificar a estrutura deste sub-espaço e relacioná-la com as propriedades holísticas das imagens (expressão e parâmetros directamente relacionados com a descrição de alto nível.
Esta abordagem pode ser generalizada a outras aplicações (sistemas automáticos de segurança baseados em reconhecimento facial; codificação de imagem com aplicação em teleconferência; animação e realidade virtual) e outras áreas (classificação em geral; estatística e análise exploratória de dados multidimensionais).
As maiores dificuldades encontradas devem-se sobretudo à subjectividade e ambiguidade das descrições, que contêem usualmente informação insuficiente para uma reconstrução conveniente, daí a necessidade da fase de interacção. É necessário ainda lidar com a complexidade da topologia do sub-espaco das caras, resultante dos efeitos complexos e interligados das variações (mesmo que pequenas) de pose, iluminação, expressão, cenário de fundo ...
A esperança resulta do facto de estes efeitos não terem influência na capacidade humana de reconhecimento, o que leva a crer que deverá existir um tipo de abordagem ou codificação das imagens que facilita extraordinariamente o problema!!
Esta página está
em construção e é mantida por Ana
Saianda
Última actualização: Junho 1997