Entenda por que Cortana ainda não fala Português e saiba se isso será possível

112

cortana pt

Já tem algum tempo que sonhamos com a assistente pessoal do Windows Phone, Cortana, falando nosso idioma. Atualmente ela fala apenas o idioma inglês (americano e britânico) e mandarim. Vejam que estamos falando justamente dos dois idiomas mais falados no mundo, e mesmo assim demorou bastante para que Cortana os “aprendesse”.

Pensando dessa forma é desanimador pensar em Cortana falando nosso idioma, já que sua popularidade não passa nem perto dos primeiros da lista, e ainda por cima tem sua complexidade gramatical e as dezenas de sotaques que podem ser encontramos não só no Brasil como também em Portugal. Será que podemos realmente sonhar com isso ou estávamos devaneando? Vamos descobrir.

As tecnologias necessárias para reconhecimento e síntese da fala em comandos para interação com softwares são a ASR e a TTS. Basicamente funcionam da seguinte forma: a ASR é responsável pelo reconhecimento das ondas sonoras e as transforma em linguagem computadorizada, então esses dados podem ser utilizados para realização de comandos, automatização de funções e, claro!, utilização por aplicações, como redigir um texto. Já a TTS é responsável pelo caminho inverso, ou seja, reconhece a linguagem computadorizada utilizada e a transforma em ondas sonoras a partir de sinais de áudio, sendo muito utilizadas por aplicações para a leitura de texto e conversão do texto em arquivo de áudio.

Pois bem, até aqui nada de novo, mas vamos dar uma olhada no cenário desse mercado em língua portuguesa.

nuance cortana SDK windows phoneEssas espécies de aplicações foram inicialmente desenvolvidas pela IBM, mediante o desenvolvimento do software IBM Via Voice, descontinuado em 2007, quando foi cedido à única empresa que se interessou: Nuance Communication Inc. No ano seguinte outra alternativa foi adquirida pela mesma companhia: Philips Speech Recognition Systems junto a Royal Philips Electronics. Daí em diante estabeleceu-se um certo monopólio no setor.

Embora as aplicações mais simples de TTS se popularizaram, as ASR simplesmente desapareceram – isso em língua portuguesa. A Microsoft, percebendo esse filão, iniciou um projeto de conversão de seu utilitário de sistema de reconhecimento de fala em Portugal, mas o encerrou em 2010, e até hoje usuários de Windows continuam sem essas funcionalidades.

O curioso é que a Nuance comercializa uma SDK em língua portuguesa, tanto brasileira quanto europeia, denominada SpeechMagic, entretanto não como uma aplicação que realize essa função.

Há alguma luz no fim do túnel? Sim, graças a Deus. A única companhia que detém tais tecnologias de síntese e reconhecimento de fala em nossa língua – aliás, uma empresa portuguesa já que os programadores brasileiros só querem saber de games – a Voice Interaction, parece voltar-se justamente apenas para o ambiente Windows.

Sabemos que esse tipo de aquisição integrada ao sistema faz-se de duas formas: ou a empresa adquire a patente junto à detentora ou adquire a licença de comercialização para utilização repassando esse custo aos consumidores, tipo se o produto custa $100,00 passará a custar $110,00, por exemplo.

Então, a situação é a seguinte, a Microsoft precisará adquirir essa SDK junto a Nuance Communication Inc. para oferecê-la aos falantes de língua portuguesa, e só assim poderemos ver Cortana nos dando bom dia no bom e velho português. Caso contrário, a Microsoft precisará criar uma solução própria para que Cortana dê suporte nosso idioma, o que é bem improvável de acontecer. Sendo assim, cremos que eles abraçarão a solução mais segura e rápida, que é adquirir o SDK da Nuance.

Fontes: Voiceinteration, Nuance 1 e 2, Revista MacMais nº 91 pag. 19 e nº 92 pag. 25

Obg ao Márcio Vianna por sua enorme contribuição 😉

Share.

About Author

Especialista em Ensino das Ciências e Matemática, Microsoft MVP - Windows Insider, músico, marido, pai, servo do Deus vivo e entusiasta dos produtos e serviços Microsoft. Carpe Diem!