Síntese de Voz


Ferramentas para auxílio no desenvolvimento de sistemas

  • http://java.sun.com/products/java-media/speech/: Biblioteca de classes e interfaces Java, desenvolvidas pela SUN, para apoio ao desenvolvimento de sistemas de síntese e reconhecimento de voz.
  • Festival: Ferramenta para desenvolvimento de sistemas utilizando síntese de voz.
  • ESTL: Edinburgh Speech Tool Kit - Utilizado pelo Festival
  • Artigos técnicos e científicos

  • Ostermnn Filho, Paulo Eduardo e Barone, Dante Augusto Couto. Desenvolvimento de Regras de Pronúncia para a Síntese de Voz em Língua Portuguesa. Semana Acadêmica da UFRGS. Porto Alegre, Julho, 2001. [html]

    Livros e tutoriais sobre o assunto

  • Cole, R. A. et alli. Survey of the State of the Art in Human Language Technology. CSLU. 1996. [html] (Livro disponível on-line)

    Outros

  • DOSVOX Projeto do núcleo de computação eletrônica da UFRJ dedicado à criação de sistemas de computação destinados a atender aos deficientes visuais.
  • FreeTTS Sistema de tradução texto-voz livre desenvolvido inteiramente na linguagem Java.
  • Interactive Multi-Lingual Demo Demo do produto desenvolvido pela AT&T, para TTS.

    Reconhecimento Automático da Fala


    Ferramentas para auxilio no desenvolvimento de sistemas

  • ISIP: Sistema de reconhecimento de fala gratuito e livre, desenvolvido pelo Instituto para Processamento de Informação e Sinais (ISIP - Institute for Signal and Information Processing), na Universidade Estadual do Mississippi. A página do projeto é um excelente ponto de referência para a área, contendo tutoriais, software, links, demonstrações, etc.
  • HTK: Ferramenta para construcao e manipulacao de HM (Hidden Markov). Excelente lista classificada de links sobre reconhecimento automático da fala.
  • LDC: Consórcio que apoia estudos na área de línguas.
  • CSLU: Excelente grupo de pesquisa na area de reconhecimento da fala. Vários manuais e softwares (proprietários).
  • Outros


    Informações sobre sistemas de telefonia digital

  • Digitro: Contem informacoes sobre a Plataforma de Comutacao Digital utilizada na UCDB.  Ver pagina sobre Protocolo Multiaplicacao.
  • Voice-Modem: Página de Niccolo Rigacci aonde ele disponibiliza um programa bastante interessante para trabalhar com voice-modem. Possui também alguns links para documentacao relacionada com os modems da US-Robotics e Rockwell.  (Disponibilizei também em download o programa de Niccolo, ja' com algumas alteracoes que ajudarao na criacao de sistema de atendimento automatico usando um "simples" modem.).
  • >> API em C++ para utilização de TCP/IP

  • CommonC++: API razoavelmente completa, com suporte do projeto GNU. Incorporou uma outra API chamada APE.
  • SocketMan: API mais simples que CommonC++ mas que parece ter tudo o que precisaremos.
  • * Em download nós disponibilizamos alguns fontes interessantes para quem quer aprender a usar TCP e Sockets.

    >> Mysql (O módulo de Banco de Dados deverá utilizar o Mysql)

    Já existe um banco de dados, MySql, com informações acadêmicas na UCDB. Deveremos acessar este banco de dados utilizando uma API em C++.
     
  • Mysql++ : API em C++ para acesso ao MySql.
  • Pagina oficial do MySQL (Servidor MySQL, GUI Clients, Documentacao, ...)
  • Dicas:

    E' preciso instalar o modulo de desenvolvimento do Mysql para compilar programas mysql++
    > http://www.mysql.com/Downloads/MySQL-3.22/MySQL-devel-3.22.32-1.i386.rpm
    Recompile os fontes do Mysql++ ao inves de usar  o RPM precompilado (Tive muitos problemas utilizando o precompilado, que foram todos resolvidos apenas com a recompilacao dos fontes).

    >> Utilitários para manipulação de arquivos de som e controle do hardware (mics,midi,auto-falantes)

  • NAS: Network Audio System - Projeto que pretende utilizar conceitos similares a plataforma cliente/servidor do X-Window mas para manipulação de som. Possui uma API que facilita a manipulação de som (Eg. tocar um arquivo wav, gravar voz atraves do microfone, ...)
  • >> Programação Multiplataforma

  • GTK+: Página com instruções sobre desenvolvimento de software multiplataforma utilizando GTK+, Glade e libGlade.
  • >> Programas Auxiliares que eu precisei usar durante o desenvolvimento

  • NMap: Utilizei este programa para detectar um problema com o servidor NAS. Entre outras coisas, ele mostra as portas (sockets) que estao ocupadas por quais processos.

  •