MIT » Engenharia Elétrica e Ciência da Computação » Laboratório de Percepção, Acústica e Fisiologia da Fala, Outono 2001 » Banco de Dados de Laboratório
6.542.J Laboratório de Percepção, Acústica e Fisiologia da Fala, Outono 2001


Base de Dados do Laboratório
Base de Dados do Laboratório
Esta página contém arquivos de mídia digitalizados
para uso nos laboratórios. A maioria dos arquivos são dados de áudio, mas também
há arquivos de imagem e outros tipos de dados.
Para alguns dos laboratórios, é necessário gravar
nossa própria voz. Se não tivermos as ferramentas para fazer tais gravações,
são providos exemplos de enunciados falados por ambos falantes, masculinos e
femininos. Os arquivos de áudio são dados abaixo sob o título do laboratório
pertinente.
Dados do lab: 1 / 2
/ 3 / 4 / 5 / 6
/ 7 / 8 / 9 / 10
/ 11 / 12 / 13
/ 14 / 15
Lab 1: Gravando
a Fala em um Ambiente AcusticamenteTratado, e Análise Espectrográfica e Edição
da Forma de Onda no Computador
No Lab 1, será gravada uma base de dados de enunciados
da fala pra uso ao longo do semestre. Temos abaixo alguns links para bases
de dados de amostra, gravadas por dois falantes: um feminino (HH) e um masculino
(KS).
Note que, embora estes arquivos tenham um
sufixo .wav, eles estão em formato Klatt, para uso com as ferramentas de análise
da fala do Klatt (xkl); eles não são um formato .wav da Microsoft. (Se houver
desejo em usar estes arquivos com ferramentas de análise que requerem o formato
MS .wav , nós podemos fornecer ambos os formatos no futuro.)
Podemos baixar aqui arquivos .tar de uma base
de dados completa:
base de dados
de amostra feminina
base de dados de amostra masculina
Arquivos individuais podem ser baixados clicando
nos links abaixo:
- Vogais do
inglês
- Consoantes
- Sentenças
- Passagem
do arco-íris, feminino
Passagem do arco-íris,
masculino
- Fala
espontânea, feminino
Fala espontânea,
masculino
[de volta ao começo]
Lab 2: Análise
Espectrográfica e Espectral do Sistema Vocálico Inglês
Serão usados os seguintes enunciados gravados
no Lab 1:
- A palavra
"shutter"
- Os pares vocálicos
simples (Itens 1-7)
[de volta ao começo]
Lab 3: Análise Espectral de Banda Larga
das Soantes
Será usado, no mínimo, um dos seguintes subconjuntos
de enunciados gravados no Lab 1:
- As palavras
"mug", "nut", e "sung"
- As palavras
"rug" e "lug"
- As palavras
"wonder" e "young"
[de volta ao começo]
Lab 4: Análise
Espectrográfica de Consoantes Oclusivas e Fricativas: Produção de Som através
de Turbulência no Aparelho Fonador
Será usado, no mínimo, um dos seguintes subconjuntos
de enunciados gravados durante o Lab 1:
- As palavras
"bug", "duck", "gut", "putt", "tug",
"cut", "hut"
- As palavras
"fuss", "thug", "supper", "shutter",
"vanilla", "the", /z
/,
/
/
- As palavras
"chump", "jump", "tug", "duck", "shutter",
/
/
[de volta ao
começo]
Lab 5: Produção
de Som na Laringe: Características da Fonte Glotal
- Parte A: Serão
usadas as palavras "bat" e "pat" gravadas por cinco falantes.
Esses enunciados já foram gravados e armazenados na conta labc. Eles também
podem ser baixados abaixo.
- Partes B-C:
Serão gravadas as palavras "pat", "pad", e "bad"
durante o laboratório. Se não tivermos condições de fazer novas gravações,
podemos baixar amostras gravadas por um falante feminino (HH) abaixo.
Baixe
um arquivo tar/zip dos enunciados (formato xkl) requeridos para este laboratório.
[de volta ao
começo]
Lab 6: Cálculos
das Freqüências de Formantes dos Dados da Função de Área
Não há enunciados para este laboratório.
[de volta ao começo]
Lab 7: Redução Segmental
Será usada a fala espontânea gravada no Lab
1.
Se não tivermos nossas próprias gravações, podemos
baixar exemplos de fala que contém interpretações claras de várias palavras
junto com interpretações das mesmas palavras produzidas com segmentos reduzidos.
O arquivo tar contém amostras dos mesmos falantes masculinos e femininos (KS
e HH) que gravaram as amostras de fala para o Lab 1.
Baixe
aqui os exemplos do Lab 7 (formato xkl). (arquivo zip/tar)
[de volta ao começo]
Lab 8: Prosódia:
Evidência Acústica para a Estrutura de Constituintes Prosódicos
Serão usados os seguintes enunciados produzidos
por quatro falantes e armazenados na conta labc:
- Parte A: Please
say Maine or Duke and Rice will play.
- Parte B: Please
say Thomas or Kenneth and Lucas will stay.
Cada sentença foi produzida com duas formas prosódicas
diferentes, e cada forma prosódica foi produzida duas vezes por cada falante,
com um total de 32 enunciados. Os enunciados estão disponíveis em dois formatos,
Xwaves (arquivos .sd e .f0) e Xkl (arquivos .wav do Klatt).
Baixe
um arquivo tar/zip dos enunciados requeridos para este laboratório.
[de volta ao começo]
Lab 9: Etiquetagem
da Entonação OU Fatores Afetando a Duração
Serão usados os enunciados da Parte A ou os enunciados
da Parte B:
- Parte A:
1) Enunciados 2-10 em arquivos lcorn.16k (formato Xwaves), localizados na
conta labc (Baixe aqui os arquivos lcorn.16k
e lcorn.f0)
2) Enunciados de Lab 8, Parte A
- Parte B:
As seguintes palavras gravadas por dois falantes: "fat", "fad",
"fade", "cup", "cub", "coop", "pick",
"pig", "peak", "men", "main`, "mate",
"tuck", "tug", "take". Estes arquivos estão
em dois formatos: Xwaves (arquivos .sd files) e Xkl (Klatt .wav). (Baixe
aqui um arquivo tar/zip dos enunciados.)
[de volta ao começo]
Lab 10:
Inteligibilidade de Fala e Matrizes de Confusão
Neste laboratório participaremos como um informante
em dois tipos de testes de inteligibilidade. Se assistirmos ao laboratório,
ouviremos os estímulos em fita cassete. Se não assistirmos a aula, podemos baixar
arquivos de áudio dos testes abaixo. A fim de fazermos os testes sozinho, precisaremos
baixar as folhas de resposta da página do Lab 10.
Um terceiro tipo de teste é disponível, embora
não apresentado na aula. Precisaremos baixar as folhas de resposta da página
do Lab 10.
[de volta ao começo]
Lab 11:
Introdução às Patologias de Fala
Serão usados enunciados produzidos por adultos
e crianças com vários tipos de patologias de fala, todos em formato Xkl (Klatt
.wav ):
- Parte 1: Enunciados
produzidos por crianças que articulam mal certos sons e enunciados produzidos
por crianças normais
Baixe
aqui um arquivo tar/zip para a Parte 1
- Parte 2: Enunciados
produzidos por crianças surdas e um adulto de audição normal
Baixe
aqui um arquivo tar/zip para a Parte 2
- Parte 3: Enunciados
produzidos por adultos com disartria e com fala normal
Baixe
aqui um arquivo tar/zip para a Parte 3
[de volta ao começo]
Lab 12:
Interpretação de Filmes Cineradiográficos de Enunciados Selecionados
Neste laboratório serão usados arquivos .gif
de imagens cineradiográficas. Devido ao fato de a base de dados completa ser
muito grande, ela será disponível somente para os estudantes que assistirem
ao laboratório. Os arquivos de amostra .gif podem ser baixados em:
Baixe
o arquivo KNS_6400995.gif, /a/ em "he`tat"
Baixe o arquivo KNS_6401423.gif,
/a/ em "soggy"
Baixe o arquivo KNS_6400919.gif,
/u/ em "he`tu"
Baixe o arquivo KNS_6401621.gif,
/u/ em "shoes"
[de volta ao começo]
Lab 13:
Síntese de Fala Usando um Sintetizador de Formantes
Para este laboratório, os estudantes gravarão
novos enunciados. Se estivermos impossibilitados de gravar dados novos, podemos
usar os enunciados de amostra providos para o Lab 5, parte B
(ou "pat" ou "bad").
[de volta ao começo]
Lab 14:
Medindo os Movimentos da Fala Usando Dados do Sistema de Micro-feixes de Raios-x
Neste laboratório serão usados dados gravados
por um sistema de micro-feixes de raios-x. Há dados para dois locutores, que
estão no formato MATLAB (arquivos .mat):
Dados de micro-feixes para o falante JW16 (quatro
arquivos .mat em um arquivo zip)
Dados de micro-feixes para o falante JW18 (quatro
arquivos .mat em um arquivo zip)
[de volta ao começo]
Lab 15:
Síntese de Alto-Nível com um Sintetizador de Formantes Usando Parâmetros Quasi-Articulatórios
Não há enunciados para este laboratório.
[de volta ao começo]
|