The SWAX Benchmark
[/trx_title]
O banco de dados Sense Wax Attack (SWAX) inclui imagens de pessoas reais e suas correspondentes esculturas realistas feitas em cera. O benchmark proposto parecia ser o único banco de dados que continha pessoas reais e modeladas com cera até a data de publicação do artigo científico . O SWAX foi projetado para investigar o problema em que uma mídia de face é apresentada a um sistema que deve determinar se categoriza uma amostra de bona fide (autêntica) or a counterfeit (ataque) sample.
Dados
O conjunto de dados SWAX proposto consiste em amostras genuínas e falsificadas para todos os assuntos disponíveis. Conforme ilustrado nas figuras abaixo (fotos de pessoas reais e bonecos de cera, respectivamente), o conjunto de dados contém fotografias rotuladas de personagens, celebridades e figuras públicas, escolhidas com base em uma lista de obras de cera obtidas de uma famosa cadeia de museus de cera. Mais precisamente, este trabalho tem como objetivo investigar a detecção de falsificação de face em cenários realistas, onde há pouco controle sobre a aquisição de imagens. Na contemplação de comparações justas de algoritmos, fornecemos quatro protocolos para o desenvolvimento e avaliação de algoritmos usando o benchmark SWAX.
O SWAX é compilado a partir de recursos on-line sem restrições e consiste em personagens, celebridades e imagens e vídeos de figuras públicas nas quais os bonecos de cera foram esculpidos. O banco de dados contém 33 indivíduos do sexo feminino e 22 do sexo masculino. É composto por 1.812 imagens e 110 vídeos de 55 pessoas/figuras. Mais precisamente, cada sujeito possui pelo menos 20 imagens estáticas autênticas e um mínimo de 10 imagens falsificadas. Todos os filmes e imagens estáticas são capturados manualmente em cenários não controlados, formados por indivíduos não cooperativos e pontos de vista distintos da câmera.
Importante:
Para fins de desenvolvimento, o conjunto de dados proposto engloba uma estratégia de validação cruzada de “deixar de fora”, na tentativa de escapar a desvios injustamente algoritmos e expor ocorrências de sobreajuste.
Para mais informações sobre esse dataset: