[LHC] ...e o verbo se fez carne - Consideracoes acerca de reconhecimento de voz

Thiago Marinello thiago at marinello.eng.br
Fri May 22 11:40:09 PDT 2015


Eu trabalhei com reconhecimento de voz em 2006/2007 em um projeto em
parceria com a Nuance. Eles forneceram o software e consultoria em
nosso projeto. Há uma seria de considerações para se determinar a
tecnologia certa para cada caso.

De lá pra cá obviamente as coisas melhoraram bastante, mas o
fundamento não sei se mudou tanto (seria preciso revisar a literatura
científica rescente para ter certeza).

Sobre a API do Google, a um tempo atrás li sobre as divergências entre
o modelo Google e o modelo Mozilla para implementar as APIs de
reconhecimento de voz propostas pelo W3C.  A Google oferce isso como
serviço enquanto a Mozilla tenta embutir todo o código no navegador.
As especificações do W3C são uma fonte interessante.

No inicio do ano o Facebook (se não me engano) comprou uma startup
americana (que não me lembro o nome) que ofecere um serviço de
reconhecimento de fala para uso em dispositivos embarcados em um
modelo IoT. O serviço deles é simplificar a adoção desta tecnologia.
Vc envia um fragmento de audio por uma API rest e recebe um JSON
estruturado com "comandos" para o seu dispositivo.

Atenciosamente,

__
 Thiago Marinello
 +55 19 992 480 860



2015-05-22 14:41 GMT-03:00 Fernando Bonafé <bonafe at opapagaiorinoceronte.net>:
> Sim, parece ate milagre neh?
> Mas nao funcionou.
> Ele fica parado esperando a fala e eu falo, falo, e nada.
>
>
> Em 22 de maio de 2015 09:18, Glauco Junior <glaucojunior22 at gmail.com>
> escreveu:
>>
>> Fernando,
>>
>> Você já tentou a API de reconhecimento do voz do Google?
>>
>> Tem uma lib para python:
>>
>> https://pypi.python.org/pypi/SpeechRecognition/
>>
>> Eu ainda não utilizei mas parece bem simples.
>>
>> Em 22 de maio de 2015 07:54, Paulo Costa <me at paulo.costa.nom.br> escreveu:
>>>
>>> Eu tentei mexer com isso vários anos atrás. As APIs eram relativamente
>>> fáceis, mas elas nunca entendiam o que eu dizia, então eu acabei desistindo.
>>>
>>> Mas eu imagino que elas tenham evoluído bastante nos últimos anos. Se
>>> você encontrar algo legal e que funciona, eu gostaria de conhecer.
>>>
>>> Já o processo contrário, texto->voz, funciona bem. Brinquei com o picotts
>>> há um tempo atrás e foi super tranqüilo
>>>
>>> Em 22/05/2015 12:01 AM, "Fernando Bonafé"
>>> <bonafe at opapagaiorinoceronte.net> escreveu:
>>>>
>>>> Tenho programado bastante em Python ultimamente e estou achando muito
>>>> facil rodar os exemplos.
>>>>
>>>> Um script de reconhecimento facial em OpenCV no python eh simples e
>>>> super poderoso.
>>>> http://docs.opencv.org/modules/contrib/doc/facerec/facerec_tutorial.html
>>>>
>>>> Agora a noite estou tentando rodar uma biblioteca de reconhecimento de
>>>> voz mas nao deu certo ainda.
>>>>
>>>> Parei para me perguntar se xs colegas usam reconhecimento de voz no dia
>>>> a dia? Se ja usaram? Ou tentaram usar? Tiveram exito ou nao foi tao simples?
>>>>
>>>> Muita paz
>>>>
>>>> Bonafeh
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> Lista do LHC <http://lhc.net.br>
>>>> HSC at listas.tia.mat.br
>>>> http://listas.tia.mat.br/listinfo.cgi/hsc-tia.mat.br
>>>>
>>>
>>> _______________________________________________
>>> Lista do LHC <http://lhc.net.br>
>>> HSC at listas.tia.mat.br
>>> http://listas.tia.mat.br/listinfo.cgi/hsc-tia.mat.br
>>>
>>
>>
>> _______________________________________________
>> Lista do LHC <http://lhc.net.br>
>> HSC at listas.tia.mat.br
>> http://listas.tia.mat.br/listinfo.cgi/hsc-tia.mat.br
>>
>
>
> _______________________________________________
> Lista do LHC <http://lhc.net.br>
> HSC at listas.tia.mat.br
> http://listas.tia.mat.br/listinfo.cgi/hsc-tia.mat.br
>



More information about the HSC mailing list