MIT » Engenharia Elétrica e Ciência da Computação » Reconhecimento Automático da Voz, Primavera 2003
| |
|
|
|
| |
Nível:
Pós-Graduação |
|
| |
|
|
| |
Instrutor(es)
Dr. James Glass Prof. Victor Zue |
|
| |
|
|
| |
Revisado
por:
Prof. Alessandro Anzaloni - ITA |
|
| |
Duração:
Duas sessões semanais de 1 hora e meia cada
|
|
| |
|
6.345 Reconhecimento Automático da Voz, Primavera 2003


Untitled Document
Destaques
deste Curso
6.345
é um curso do departamento de Engenharia Bio-Elétrica. Traz um conjunto completo
de slides de aulas acompanhado
de exemplos de voz, além tarefas
e outros materiais usados no curso.
Descrição
do Curso
6.345
introduz os estudantes no campo de rápido desenvolvimento que é o do reconhecimento automático
da voz. Seu conteúdo está dividido em três partes. A Parte I lida com materiais
de base para a teoria acústica da produção de voz, fonética acústica e representação
de sinais. A Parte II descreve aspectos de sistemas de reconhecimento de voz
sob o ponto de vista de algoritmos incluindo classificação de padrões, algoritmos
de busca, modelamento estocástico e técnicas de modelamento de linguagem. A
Parte III compara e contrasta os vários procedimentos para o reconhecimento
da voz e descreve técnicas avançadas usadas para o modelamento fonético acústico,
reconhecimento robusto da voz, adaptação ao locutor, processamento da informação
paralingüística, compreensão da voz e processamento multimodal.
Requisitos
Técnicos
Softwares
de mídia, como o Quicktime®
Player, o RealOne?
Player, ou Windows
Media® Player são necessários para executar os
arquivos .wav deste curso.
RealOne?
é marca registrada da RealNetworks, Inc.
QuickTime®
é marca registrada da Apple Computer, Inc., registrada nos EUA e outros países.
Windows
Media® é marca registrada da Microsoft Corporation nos EUA e outros
países.
|