quinta-feira, 19 de maio de 2011

Nova tecnologia ajuda veículos de comunicação

Agência Usp

Nova técnica computacional foi elaborada para facilitar a busca por vídeos digitais, que atualmente é feita com base em textos em sua maior parte, como no site do Youtube. O método é um algoritmo que segmenta os vídeos em cenas, integrando informações de texto, imagem e som. Segundo o cientista Danilo Coimbra, autor do projeto, a técnica é interessante para as emissoras que desejam disponibilizar o conteúdo de seus telejornais na Web de modo que os internautas possam navegar de maneira mais fluente entre as notícias. “O método multimodal é mais preciso que outros já utilizados, pois propõe uma busca mais apurada. Pode ser aplicado para a personalização de conteúdo considerando as preferências do usuário, uma tendência na área de recuperação de informação em vídeos.”

O gênero de vídeo com o qual Coimbra trabalhou foi o telejornal. Foram utilizados vinte episódios de quatro telejornais brasileiros nos quais a técnica seria aplicada. Como explica o autor, o algoritmo identifica e indica o momento de transição entre duas cenas, e, a partir disso, faz a segmentação do vídeo em partes menores. Para medir a eficácia do algoritmo, o pesquisador assistiu aos telejornais, documentando manualmente os momento em que havia mudança de cena. Em um segundo patamar da pesquisa, aplicou a técnica nesses mesmos telejornais, obtendo os resultados oferecidos pelo programa. Então, comparou os dois modelos, analisando quantas cenas o algoritmo detectou e quantas não detectou. Segundo Coimbra, os resultados apontam que a técnica se apresentou 17 % mais precisa do que as outras técnicas monomodais analisadas, além de recuperar um número maior de cenas.
 
Três mídias
Para desenvolver a técnica, o primeiro passo de sua pesquisa foi definir semanticamente o que seria considerado cena, para transformar esse conceito em linguagem técnica no algoritmo. “Uma definição mais ampla de ‘cena’ é uma das peculiaridades do método, que proporciona um resultado melhor na segmentação”, afirma. Para o autor, há mudança de cena em um jornal quando há mudança de assunto. “Notícias diferentes são cenas diferentes; vinhetas e blocos de comercial também são assuntos distintos.”

De acordo com o estudo, em um telejornal, o áudio, a imagem e o texto emitem sinais de que haverá uma mudança de assunto, ou seja, de cena. Isso acontece nos vídeos em geral. A técnica desenvolvida na pesquisa integra as três mídias, levando em conta as características peculiares de cada uma. Para elaborar a técnica multimodal, Coimbra integrou seis métodos monomodais, cada um capaz de apontar a transição de cena por intermédio de sua respectiva mídia. Três deles com características visuais, dois com áudio e um com texto.

O cientista conta, por exemplo, que a nova técnica capta os momentos em que há silêncio, que geralmente indicam que haverá uma mudança de cena. “Essa é uma das informações referentes ao som, e diz respeito ao momento em que um repórter termina de falar para que um âncora (apresentador do telejornal) inicie a apresentação de outro assunto. Nesse interim, há o silêncio”.

Coimbra explica que esse é um dos casos por meio dos quais a técnica identifica a mudança de cena. No tocante às imagens, o autor exemplifica dizendo que o algoritmo detecta cenas analisando a imagem do âncora, o que também indica que vai haver transição de um assunto para o outro, ou seja, de uma cena para outra. Mas podem ocorrer equívocos, e o algoritmo apontar uma transição que não existe, por exemplo quando há um diálogo entre os dois âncoras, que necessariamente não representam mudança de cena. Nesse sentido, Coimbra aponta que isso acontece menos quando é aplicada uma técnica multimodal, uma vez que “as vantagens das técnicas monomodais integradas compensam suas limitações quando utilizadas em separado”.

Nenhum comentário:

Postar um comentário