domingo, 4 de março de 2012

Sintetizador de voz controlado pelas mãos permite falar por gestos


Redação do Site Inovação Tecnológica - 25/02/2012
Sintetizador de voz controlado pelas mãos permite falar por gestos
O sintetizador gestual de voz permite que um artista faça um dueto consigo mesmo, cantando com seu aparelho vocal normal e produzindo a segunda voz por meio dos gestos.[Imagem: Sidney Fels/UBC]
Dueto de 1
Uma nova tecnologia desenvolvida no Canadá permite que uma pessoa fale ou cante usando apenas suas mãos para controlar um sintetizador de voz.
Sidney Fels, da Universidade da Colúmbia Britânica, afirma que sua tecnologia "sintetizador gesto-para-voz" replica os processos que os humanos usam quando controlam o seu próprio aparelho vocal.
"É como tocar um instrumento musical que emite voz," simplifica Fels.
As aplicações da nova tecnologia poderão incluir desde novas formas de expressão musical e auxílio para pessoas com deficiências da fala, até o controle gestual de grandes equipamentos industriais.
Além, é claro, da inusitada apresentação de um artista que faz um dueto consigo mesmo, cantando com seu aparelho vocal normal e produzindo a segunda voz por meio dos gestos.
Vogais abertas e consoantes fechadas
Os pesquisadores construíram luvas especiais, equipadas com sensores de posição 3-D, que determinam a posição de cada mão no espaço.
Determinadas posturas das luvas estão associadas com áreas definidas do espectro de áudio.
Sintetizador de voz controlado pelas mãos permite falar por gestos
O aparelho é semi-portátil, podendo ser adequadamente disfarçado por uma mochila. [Imagem: Sidney Fels/UBC]
A luva da mão direita tem sensores para detectar a flexão. Quando o usuário fecha a mão, ela cria sons consonantais - os pesquisadores desenvolveram uma coleção de gestos que são mapeados para sons consonantais.
Quando o usuário abre a mão direita, ele produz sons de vogais, da mesma forma que acontece no trato vocal quando a língua se movimenta. A emissão das vogais é controlada pela localização da luva no espaço horizontal.
A luva direita também controla a ritmo da fala pela sua localização vertical no espaço.
Os controles da luva esquerda controlam os chamados "sons de parada" - como a consoante "B".
Controle de guindastes
"Outras aplicações possíveis para esta inovação são interfaces para tornar mais fácil a execução de determinadas tarefas, tais como controle de guindastes ou outras maquinarias pesadas," diz Fels.
"Leva cerca de 100 horas para uma pessoa aprender a falar usando o sistema," diz Fels, cujos interesses de pesquisa incluem interação humano-computador, modelagem biomecânica das vias aéreas superiores, síntese da fala e redes neurais.

sexta-feira, 2 de março de 2012

Programa encontra melhor música de fundo para fotografias


Redação do Site Inovação Tecnológica - 27/02/2012
Programa encontra melhor música de fundo para fotografias
A imagem ou fotografia é comparada com uma gigantesca base de dados de cenas de filmes e suas trilhas sonoras. [Imagem: Saarlandes Universitat/bellhäuser]
Cientistas alemães desenvolveram um programa capaz de selecionar uma trilha sonora para uma fotografia ou imagem.
O programa sistematiza a técnica usada por produtores de filmes para atribuir uma música de fundo adequada para cada cena - com muito menos trabalho, é claro.
Três níveis
O processo é realizado por um algoritmo que opera em três níveis.
Para começar, a imagem ou fotografia é comparada com uma gigantesca base de dados de cenas de filmes - os quadros do filme entendidos como imagens individuais - e das trilhas sonoras que os diretores escolheram para elas.
É essa base de dados, que cresce continuamente, que permite que o programa parta de um expertise humano, e não de uma mera escolha aleatória.
No segundo nível, o programa cria uma lista das trilhas sonoras atribuídas às imagens que mais se parecem com a imagem escolhida pelo usuário.
Finalmente, no terceiro nível, o programa usa um cálculo matemático para eliminar redundâncias, e mostra ao usuário apenas as opções mais fidedignas.
Associações subjetivas
Segundo Aleksander Stupar e Sebastian Michel, criadores do programa, batizado de Picasso, apresentar uma lista de possíveis trilhas sonoras ao usuário faz mais sentido do que o programa fazer a escolha final porque cada imagem em particular traz diferentes associações para diferentes usuários.
Os interessados podem fazer sua própria avaliação do Picasso no site de demonstração do projeto, mantido pela Universidade de Saarland.
O endereço é http://picasso.mmci.uni-saarland.de/demo/.