Sinteza hrvatskoga govora utemeljena na odabiru jedinica i stohastičkim modelima

ResearchClass
Predavač: Miran Pobar
Datum: 23.10.2014.

Sažetak:
Prezentiran je razvoj sustava za sintezu hrvatskoga govora koji omogućuje automatsku pretvorbu proizvoljnog teksta u govorni oblik. Za izgradnju sustava korištene su metode odabira jedinica i statističke parametarske sinteze te je predložena hibridna arhitektura koja objedinjuje obje metode. Govor dobiven pomoću statističke parametarske sinteze govora zvuči razumljivo i obično ima ujednačenu kvalitetu, no veću prirodnost je moguće ostvariti metodom odabira jedinica. Međutim, kod sinteze odabirom jedinica čak i mali broj jedinica koje se loše povezuju s ostalima u lancu mogu znatno narušiti dojam kvalitete. Stoga se u predloženoj hibridnoj metodi predlaže korištenje stohastičkih modela F0 za odbacivanje nizova koji sadrže jedinice koje prema modelu imaju premalenu vjerojatnost.
Za automatsku objektivnu evaluaciju razumljivosti umjetnog govora predložena je mjera temeljena na rezultatima automatskog raspoznavanja govora koja je korištena za optimiranje parametara hibridnog sustava. Govor koji je točno automatski raspoznat i slušaoci su ocijenili boljim čime se potvrđuje opravdanost korištenja predložene objektivne mjere za optimiranje sustava za sintezu govora. Provedena je subjektivna evaluacija kvalitete umjetnog govora razvijenih sustava. Za slučaj sinteze tekstova unutar domene korpusa za učenje najbolje je ocijenjena sinteza odabirom jedinica grupiranjem, dok je za tekstove izvan domene najbolje ocijenjen hibridni sustav.