Pesquisa do Sense chega à Oceania: Igor Bastos tem seu trabalho aceito na AVSS 2018

O aluno de doutorado Igor Bastos foi selecionado para apresentar sua nova abordagem para reconhecimento de gestos na 15ª Conferência Internacional do IEEE sobre Vídeo Avançado e Vigilância Baseada em Sinal (AVSS). Organizado pelo Instituto de Engenheiros Elétricos e Eletrônicos (IEEE), o AVSS 2018 será realizado em Auckland, Nova Zelândia, de 27 a 30 de novembro.

Devido à sua aplicabilidade em contextos como vigilância e autenticação biométrica, o reconhecimento de gestos tem sido investigado por diversos trabalhos, muitas vezes com foco na captura de movimento e aparência em vídeos. No entanto, a maioria dos trabalhos anteriores não exploram adequadamente a estrutura temporal bem definida dos gestos e não são adequados para lidar com um grande número de gestos.

Em sua pesquisa, Bastos propõe o MultiOutput Recurrent Autoencoders (MORA), uma abordagem que depende da representação de cada classe de gestos de forma independente. A MORA emprega um modelo específico de autoencoder por classe, composto por uma camada convolucional (3D) e uma unidade Gated Recurrent Unit (GRU), que permite a extração de informações espaço-temporais e a escalabilidade em termos de número de classes.

“Usamos uma estratégia um pouco diferente do que os pesquisadores normalmente usam para reconhecimento de gestos. Normalmente, modelos discriminatórios baseados na classificação supervisionada tradicional são empregados. No nosso caso, adaptamos modelos não supervisionados e fazemos uma espécie de competição entre eles. A principal vantagem da abordagem é a escalabilidade em relação ao número de gestos e a robustez ao desequilíbrio de classes. É uma estratégia muito diferente da literatura e alcançou bons resultados ”, explica Igor.

Para validar a MORA, foram realizados experimentos nos datasets SKIG e ChaLearn IsoGD, nos quais a abordagem alcançou exatidões comparáveis ​​aos métodos de ponta.

A pesquisa teve apoio financeiro do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), da Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG) e da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) por meio do Projeto DeepEyes.

O pesquisador

Igor Bastos é formado em Engenharia da Computação pela Universidade Estadual de Feira de Santana (UEFS) e possui mestrado em Ciência da Computação pela Universidade Federal da Bahia (UFBA), com a dissertação “Reconhecimento de Sinais de Libras Usando Descritores de Formulários e Redes Neurais Artificiais”. Tem experiência na área de Visão Computacional, atuando principalmente no processamento de imagens, redes neurais e cefalometria.

A publicação

Liderada por Igor Bastos, a pesquisa contou também com contribuições dos alunos de doutorado Victor Hugo Melo e Gabriel Resende Gonçalves. O professor William Robson Schwartz, coordenador do Smart Sense Laboratory, orientou os esforços. A publicação pode ser acessada aqui.

AVSS 2018

Em sua 15ª edição, a Conferência Internacional sobre Vídeo Avançado e Vigilância Baseada em Sinal enfoca a teoria, métodos, sistemas e aplicações subjacentes da vigilância. AVSS é a principal conferência no campo da vigilância baseada em vídeo e sinal e reúne especialistas da academia, indústria e governo para promover teorias, métodos, sistemas e aplicativos relacionados à vigilância. Desde a sua criação, o evento já foi sediado em quatro continentes.

Siga as atualizações do Smart Sense Laboratory através do nosso Facebook e Twitter.