Cade Metz, The New York Times

SAN FRANCISCO - Em julho, dois dos maiores laboratórios de inteligência artificial do mundo revelaram um sistema capaz de fazer leitura labial.

Projetado por pesquisadores do Google Brain e da DeepMind - laboratórios que pertencem à Alphabet, empresa dona do Google - o sistema automatizado conseguiu até superar profissionais humanos de leitura labial. Ao aplicar as técnicas de leitura labial em vídeos, o sistema identificava a palavra errada em cerca de 40% das vezes, enquanto os profissionais erram em cerca de 86% dos casos.

Num estudo explicando o funcionamento da tecnologia, os pesquisadores a descreveram como forma de ajudar pessoas com problemas na fala. Eles disseram que, em tese, ela poderia permitir que as pessoas se comunicassem apenas movendo os lábios.

Mas os pesquisadores não comentaram a outra possibilidade: uma vigilância mais avançada. Um sistema de leitura labial é aquilo que os responsáveis pelas políticas públicas chamam de “tecnologia de uso duplo", definição que se aplica a muitas das novas tecnologias que vêm surgindo dos principais laboratórios de inteligência artificial. Sistemas que geram vídeo automaticamente podem melhorar a produção de filmes - ou facilitar a criação de notícias falsas. Um drone pode ser usado com uma câmera para filmar um evento esportivo - ou pode ser armado para uso no campo de batalha.

Agora, um grupo de 46 pesquisadores chamado Future of Computing Academy está insistindo para que a comunidade pesquisadora repense sua maneira de compartilhar os avanços. Eles dizem que, ao divulgar novas pesquisas, os cientistas devem explicar como a tecnologia pode afetar a sociedade, tanto nos aspectos positivos quanto nos negativos.

“A indústria da computação pode ficar como as indústrias do petróleo e do tabaco, preocupadas apenas em avançar, seguindo as ordens de nossos chefes, sem pensar nas implicações", disse o professor Brent Hecht, da Universidade Northwestern, em Illinois, e líder do grupo. “Ou podemos ser a geração que começa a pensar de maneira mais ampla.”

Ao publicar novas obras, os pesquisadores raramente debatem os efeitos negativos. Isso ocorre em parte por causa do desejo de apresentar seu trabalho sob uma ótica positiva - e em parte porque eles estão mais preocupados em construir a tecnologia do que em usá-la. Empresas de capital aberto raramente debatem os potenciais aspectos negativos do seu trabalho. Hecht e seus colegas estão pedindo às publicações científicas que rejeitem os estudos que não explorarem também esse lado negativo.

Será que o sistema de leitura labial do Google pode ser usado para aumentar a vigilância? Talvez ainda não. Ao “treinar” seu sistema, os pesquisadores usaram vídeos que mostravam rostos de perto e de frente. As imagens de câmeras de rua “são precárias demais para uma leitura labial", disse o pesquisador Joon Son Chung, da Universidade de Oxford.

Mas as câmeras estão se aprimorando e os pesquisadores estão constantemente refinando as técnicas de IA que impulsionam esses sistemas. Pesquisadores chineses acabam de revelar um projeto que pretende usar técnicas semelhantes para a leitura labial em “ambiente selvagem”, acomodando diferentes condições de iluminação e qualidade de imagem.

Stavros Petridis, pesquisador ligado à Imperial College de Londres, disse que esse tipo de tecnologia pode vir a ser empregado na vigilância. “Hoje, podemos dizer que há bons e maus usos para tudo aquilo que inventamos".