Ѭ Ѭ Ѭ Ѭ Ѭ Normal style Print style No style
PB095 - Úvod do počítačového zpracování řeči
1. prednaska chybi

Zvuk

Řeč

Historie emulace řeči

2. prednaska 2013-09-23 15:56:42

Fysikální akustika

Perioda, frekvence

Rychlost šíření zvuku

Hmotný bod na nehmotné pružině

Tlumene kmitani

Vlastní / vynucené kmitání, resonance

Akusticka intensita

Formanty

Základní, složený tón

Základní

Složený

Fysiologicka akustika

vytvareni reci

Helmholtzův rezonátor

Vnimani zvuku

Vytvareni reci

3. 30.09.2013 16:04:10

Fonetika

Proces digitalisace zvuku

Vzorkovani

Kvantisace

Kodovani

4. 07.10.2013 16:02:33

Zpracování digitalisovaného signálu

Metody krátkodobé analysy

Analysa signálu v časové oblasti

Funkce krátkodobé energie

Funkce krátkodobé intensity

Krátkodobá fuknce středního průchodu nulou

Diferenční klasifikátor

Krátkodobá autokorelace

Zpracování signálu ve frekvenční oblasti

Fourierova transformace

DFT

FTT - Rychlá FT

Kepstrální analysa

Lineární prediktivní analysa

5. 14.10.2013 16:03:42

Rozpoznávání řeči

Cíle

Isolované příkazy

Vektory příznaky

Klasifikátory

DTW (Dynamic Time Warping)

-

Realisace klasifikátoru

Postup:
  1. uživatel vysloví postupně slova
  2. digitalisace slov
  3. vytvoření posloupnosti příznaků
  4. detekce slov
  5. vytvoření referenčních obrazů slov

Refereční obrazy

Nevýhody DTW

A tady toho spousta chybí…

Hidden Markov Models

u zkousky principy DTW, zakladni princim HMM, nebude u zkousky vypocty pravdepodobnosti
6. 21.10.2013 15:56:02

Rozpoznávání plynulé promluvy

Rozdíly

Řešení

Jazykové modely

Úspěšnost rozpoznávání plyn. řeči

Metody zvýšení úspěšnosti

Synthesa řeči

Fáze synthesy řeči

  1. fonetický přepis
  2. synthesa transkripce
  3. postprocessing

Synthesa ve frekvenční oblasti

Synthesa v časové oblasti

07. 04.11.2013 16:05:17

Synthesa v časové oblasti - pokračování

.
.
.

Slabičné segmenty

11.11.2013 - chybí

Dialogové systémy

18.11.2013 16:03:40

Dialogové systémy

VoIP

Omezení vstupu

2013-11-25 16.12:08

W3C

Standardy W3C

VoiceXML

Architektura VXML app

server <→ voiceXML interpret <→ implementační platforma (komunikace interpretu s userem)

VoiceXML form

Last update: 2014-01-16 11:18:53 UTC