983706779

terça-feira, 28 de maio de 2013

O próximo passo das buscas na internet

Evolução e popularização dos sistemas que realizam pesquisas na web a partir de músicas e fotos deve empurrar as fronteiras do setor

(Thinkstock)
Renata Honorato e James Della Valle

No começo, era apenas o verbo. Mas a busca por sons e imagens avança rápido - e como em todo sistema operado por algoritmos, é uma questão de tempo e "aprendizado" que ela dê um salto exponencial de qualidade na internet. No caso de arquivos sonoros, a mágica de "advinhar" qual a canção, seu intérprete e compositor com base num trecho capturado do rádio ou do ambiente já é feita com precisão considerável por aplicativos para celular como Shazam e SoundHound. Na seara das imagens, as aplicações estão sendo aperfeiçoadas por companhias como Google, que trabalham pesado para interpretar informações como cor e forma - primeiro passo no caminho para submeter fotos e vídeos a um processo eficaz de busca .

O Shazam surgiu em 1999, em Londres, e até hoje é o aplicativo mais popular do segmento de reconhecimento de música. Nos 14 anos de vida, passou por aprimoramento contínuo. "Atualmente, os sistemas de reconhecimento de áudio identificam canções ainda que haja ruídos. Além disso, podem fazer seu trabalho mesmo que você só apresente um pequeno trecho da música", diz Régis Rossi Alves Faria, pesquisador e coordenador do núcleo de engenharia de áudio e codificação sonora da Universidade de São Paulo (USP). Essa evolução está diretamente associada à inteligência artificial desses mecanismos, que aprendem conforme novas buscas vão sendo realizadas. 

O Shazam possui 300 milhões de usuários – 3,3% estão no Brasil. Diariamente, ele "adivinha" mais de 10 milhões de músicas. O serviço mantém parcerias com Apple e Amazon para a comercialização de faixas: depois de elucidar a charada, encaminha a venda. "Neste ano, o Shazam movimentará mais de 300 milhões de dólares com essa atividade", afirma David Jones, presidente executivo de marketing da companhia. Jones não detalha quantos milhões desse total vão parar nos cofres da empresa britânica, mas adianta que nos Estados Unidos o serviço foi expandido para a TV. “Os fãs já podem usar o aplicativo para obter informações sobre programas de televisão em 160 canais."

O principal concorrente do Shazam é o SoundHound, que possui 135 milhões de usuários em todo o mundo. Segundo Katie McMahon, vice-presidente de marketing e vendas da empresa, o Brasil está entre os três mercados que mais crescem dentro do serviço. O modelo de negócio é similar ao do rival. “Temos parcerias com as mais importantes lojas digitais e somos um dos serviços móveis mais bem-sucedidos em termos de conversão de compra de música via download ou streaming”, explica a executiva.

Se o sistema de reconhecimento de áudio já está bem resolvido, a identificação de imagens ainda caminha em marcha lenta. O Google Goggles, aplicativo que permite realizar buscas na internet a partir de fotos de objetos e lugares, é pouco funcional. A razão é simples: a tecnologia exigida para a tarefa é mais complexa. Ao invés de fazer apenas uma comparação de frequências sonoras, como ocorre no caso do áudio (confira na arte acima), o reconhecimento de imagem depende de um número maior de variáveis, como forma, cor e profundidade.

Segundo Roseli de Deus Lopes, professora do departamento de sistemas eletrônicos da Escola Politécnica da Universidade de São Paulo (USP), as buscas, em geral, são insatisfatórias porque essas pesquisas exigem um banco de dados vasto e algoritmos matemáticos que precisam ser treinados levando-se em conta muitas probabilidades. “Em algumas áreas de aplicação, principalmente em nichos específicos, as taxas de acerto são mais altas. A aplicação genérica, no entanto, ainda deixa a desejar”, diz. Bem como nos sistemas de reconhecimento de áudio, a inteligência artificial também é importante para a precisão dos resultados. Isso porque os algoritmos tem que aprender em que contexto determinadas imagens aparecem com mais frequência. Um chapéu, por exemplo, geralmente aparece sobre uma cabeça - e não o contrário. 

Embora cada sistema de reconhecimento evolua de forma distinta, o futuro da busca está na fusão de todos esses elementos. De acordo com Bruno Carvalho, diretor de tecnologia da Agência Tree, áudio, imagem e texto trabalharão em conjunto para oferecer aos usuários respostas mais ricas e adequadas a suas pesquisas. Isso ajudará na evolução dos sistemas de buscas na direção de um modelo desejado, mas apenas tangenciado até agora na rede: o da web semântica.

Seguindo o conceito apresentado por Tim Berners-Lee, físico britânico considerado pai da internet, a web (e por extensão a busca) semântica pretende atribuir sentido às informações presentes na internet de forma que os robôs, responsáveis pelas buscas, compreendam o contexto em que se inserem textos, fotos, músicas, vídeos — enfim, todos os conteúdos da web. É o que, no limite, aproximaria a pequisa feita por humanos e máquinas, permitindo a elas diferenciar, por exemplo, o animal jaguar do carro de luxo de mesmo nome. "Hoje em dia, a ambiguidade ainda é um dos maiores problemas para os computadores. A semântica está chegando para solucionar essa questão", afirma Carvalho.

Problemas já resolvidos pela busca de áudio e imagem

Qual é a música?

Uma pergunta universal agora pode ser respondida graças à tecnologia de reconhecimento de áudio. Ao escutar uma música, o usuário pode simplesmente acionar um aplicativo em seu smartphone e ter acesso ao nome da canção e seu intérprete. Se quiser, pode comprar a faixa por meio de serviços como o iTunes.

Solução: Shazam, SoundHound

Postar um comentário
UA-15674926-13