Podatkovni vi - PowerPoint PPT Presentation

About This Presentation
Title:

Podatkovni vi

Description:

Title: SPVP Author: Josko Last modified by: joskorokov Created Date: 5/29/2005 7:18:06 PM Document presentation format: On-screen Show Other titles – PowerPoint PPT presentation

Number of Views:43
Avg rating:3.0/5.0
Slides: 14
Provided by: Josk56
Category:

less

Transcript and Presenter's Notes

Title: Podatkovni vi


1
Podatkovni višemedijski prijenos i racunalne
mrežeSpeech Recognition
Sveucilište u Zagrebu Fakultet Elektrotehnike i
racunarstva Zavod za elektronicke sustave i
obradbu informacija
  • Joško Rogulj
  • Joško Rokov
  • Nino Talian
  • Sijecanj 2006.

2
Sadržaj
  • Uvod
  • Princip rada
  • Primjene
  • Komercijalni sustavi
  • Besplatni sustavi
  • Usporedba
  • Zakljucak
  • Literatura

3
Uvod
  • Prepoznavanje govora je proces kojim racunalo
    identificira izgovorene rijeci
  • Velik broj rješenja s tehnologijom raspoznavanja
    govora
  • Kompleksnost problema

4
Princip rada
  • Koraci sustava za raspoznavanje
  • Snimanje govora i detekcija iskaza
  • Predfiltriranje
  • Uokviravanje
  • Filtriranje (opcionalan korak)
  • Usporedba
  • Djelovanje

5
Princip rada
  • Podjela s obzirom na tipove iskaza koji se mogu
    detektirati
  • Izolirane rijeci
  • Povezane rijeci
  • Kontinuirani govor
  • Spontani govor
  • Provjeravanje/identifikacija govora

6
Primjene
  • Diktiranje
  • Naredbe/kontrola
  • Telefonija
  • Prijenosni uredaji
  • Medicinske svrhe
  • Ugradeni (embedded) sustavi

7
Komercijalni sustavi
  •  Dragon Naturally speaking (Nuance) --
    http//www.nuance.com/
  •  IBM ViaVoice -- http//www.scansoft.co.uk/viavoic
    e/
  •  SpeakToText (CoolSoft) -- http//www.coolsoftllc.
    com
  •  VR Commander (Interactive Voice Technologies) --
    http//www.vrcommander.com/
  •  Audiomatic (Wise Riddles Software) --
    http//www.wiseriddles.com/Audiomatic
  •  e-Speaking (e-speaking) -- http//www.e-speaking.
    com/
  •  Realize Voice Lite (Realize Software) --
    http//www.realizesoftware.com
  •  Voice Studio (Ultimate Interactive Desktops) --
    http//www.voicestudio.us
  •  Abbot (Softsound) -- http//www.softsound.com
  •  Dictation Buddy (High Criteria) --
    http//www.highcriteria.com
  •  MacSpeech iListen -- http//www.macspeech.com/
  • ...

8
Dragon NaturallySpeaking 8
  • Radi iskljucivo pod Windowsima
  • Najveca tocnost (gt98)
  • Izabir razlicitih vokabulara (opci,
    medicinski,...)
  • Najlakša instalacija, podešavanje i korištenje
  • Diktiranje teksta u bilo koji tekst editor
  • Ugradena NBS tehnologija za zanemarivanje zvukova
    koji nisu rijeci
  • Posebni nacini rada za slovkanje, numeriranje,
    zadavanje naredbi i diktiranje
  • Mnoštvo ugradenih glasovnih naredbi (mogucnost
    nadogradnje)
  • Automatsko umetanje interpunkcijskih znakova
  • Korištenje profila više korisnika na istom
    racunalu
  • Cijena od 200 500 (ovisno o paketu)

9
IBM ViaVoice 10
  • Namijenjen za Windows OS, Mac OS i Linux
  • Visoka tocnost (gt96)
  • Vokabular od 300 000 rijeci
  • Mogucnost odabira US English i UK English
  • Diktiranje teksta u bilo koji tekst editor
  • Vodi racuna o kontekstu teksta
  • Prepoznaje i filtrira nepoželjne zvukove
  • Upravljanje i kontroliranje aplikacija govorom
  • Cijena 30 50 (ovisno o paketu)

10
Besplatni (OpenSource) sustavi
  •  Xvoice -- http//xvoice.sourceforge.net/
  • Open Mind Speech -- http//freespeach.sourceforge.
    net/
  • CMU Sphinx -- http//cmusphinx.org
  • NICO toolkit -- http//nico.sourceforge.net/
  • GVoice -- http//www.cse.ogi.edu/omega/gnome/gvoi
    ce/
  • CVoiceControl -- http//www.kiecza.de/daniel/linux
    /index.html
  • ...

11
Usporedba
Program Platforma Cijena Specificnosti
Dragon Naturally Speaking 8 Windows only 200-500 (ovisno o verziji) -automatska interpunkcija -Smart formatting i naredbe -Makro podrška -... i sve ostalo što drugi paketi imaju ali NAJVECA cijena
IBM ViaVoice 10 Windows Mac Linux 30-50 -ima manju funkcionalnost od Dragon-a -podrška za sve sustave -konkurira NIŽOM cijenom
XVoice Linux Besplatan -jednostavan za korištenje -nadogradiv -mala funkcionalnost i tocnost -BESPLATAN JE!
12
Zakljucak
  • Ocekivanja
  • Veci broj komercijalnih proizvoda
  • Niže cijene postojecih rješenja
  • Razvoj boljih algoritama
  • Veci broj OpenSource rješenja
  • Nove primjene

13
Literatura
  • http//www.tldp.org/HOWTO/Speech-Recognition-HOWTO
    /
  • http//www.nuance.com/naturallyspeaking
  • http//www.scansoft.co.uk/viavoice/
  • http//sourceforge.net
  • ...
Write a Comment
User Comments (0)
About PowerShow.com