CENTRALNA AUDIO-BIBLIOTEKA UNIVERZITETA U NOVOM SADU Vlado Delić, Dragiša Mišković, Siniša Suzić, Tijana Delić, Branislav Popović, Nikša Jakovljević, Milan Sečujski Univerzitet u Novom Sadu, Fakultet tehničkih nauka, Novi Sad, Srbija vlado.delic@uns.ac.rs Kratak sadržaj:U radu je predstavljenprojekat Centralna audio-biblioteka Univerziteta u Novom Sadu (CABUNS) čiji je cilj da se omogući automatizovano kreiranje audio-izdanja udžbenika, prezentacija i drugih nastavnih materijala pomoću nove tehnologije za sintetizovanje govora na osnovu teksta na srpskom jeziku. Opisanisu arhitektura i funkcionalnosti realizovanog sistema, kako sa strane nastavnika i asistenata koji postavljaju nastavne materijale na CABUNS server, tako i studenata kao korisnika koji preuzimaju audio-izdanja i slušaju ih (i gledaju) preko svojih računara ili telefona.Na prezentaciji rada će biti prikazani primeri prvih audio-izdanja udžbenika i Power Point prezentacija iz predmeta Akustika i audio-tehnika. Analizirane su prednosti i nedostaci ove nove digitalne tehnologije učenja koja ima perspektive da značajno doprinese kvalitetu visokog obrazovanja, ali i svih drugih nivoa obrazovanja. Predstavljeni su i najnoviji rezultati u razvoju sintetizatora govora koji omogućuju konverziju karakteristika glasa govornika tako da će u narednom periodu biti omogućena produkcija audio-izdanja sa glasom nastavnika koji su napisali date udžbenike i/ili održali predavanja uz date prezentacije. Ključne reči:Audio-biblioteka, audio-izdanja udžbenika, nove digitalne tehnologije učenja, sintezagovora na osnovu teksta, duboke neuronske mreže, konverzija govornika CENTRAL AUDIO LIBRARY OF THE UNIVERSITY OF NOVI SAD Abstract:The paper presents the project Central Audio-Library of the University of Novi Sad (CABUNS), aimed at automated creation of audio-editions of textbooks, presentation and other course material using the new technology of text-to-speech synthesis in the Serbian language. The paper describes the architecture and the features of the developed system, from the points of view of both teachers and assistants who upload course material to the CABUNS server as well as students who download audio-editions and listen to them (and view them) using their computers and mobile telephones. The examples of the first audio-editions of textbooks and PowerPoint presentations related to the course Acoustics and Audio Engineering are presented. The paper also analyzes the advantages and drawbacks of this new learning technology, which has a potential to greatly contribute to the quality of higher education, but also to education at other levels. The paper also presents the most recent results in the development of text-to-speech, enabling speaker conversion, which means that very soon it will be possible to produce an audio-edition in the voice of the lecturer who has actually written the textbook and/or delivered a lecture using the presentation. Key Words: Audio-library, audio-editionsof textbooks, new digital learning technologies, text-to-speech synthesis, deep neural networks, speaker conversion UVOD Sve brži tempo života i potreba za efikasnim iskorišćenjem vremenskih resursa doveli su do popularizacije audio knjiga. Ova tehnologija omogućava ,,čitanje" knjige bez upotrebe ruku i očiju, npr. u javnom prevozu, uz odmor ili u šetnji. Iako su prvobitne audio knjige sadržavale samo književna dela, vremenom se javila potreba da se i stručna literatura učini dostupnom u audio formatu. Arhitektura jednog takvog sistema opisana je u radu [1]. Proces snimanja kvalitenih audio knjiga čiji sadržaj čitaju profesionalni govornici je vremenski i finansijski zahtevan. Stoga se korišćenje sinteze govora na osnovu teksta (TTS) nametnulo kao rešenje. Međutim, konkatenativni pristup sintezi, koji je dugo smatran za najbolji, ipak je imao relativno malu prijatnost slušanja generisanog govora zbog monotonosti intonacije i artefakata. Razvoj sinteze govora na osnovu teksta u poslednjih nekoliko godina omogućio je ne samo poboljšanje prirodnosti sintetizovanog govora, nego i promenu glasa govornika kao i stila govora koristeći relativno male govorne baze za obuku modela[2-6]. Centralna audio biblioteka Univerziteta u Novom Saduje projekat u kom se korišćenjem audio knjiga želi unaprediti i olakšati visoko obrazovanje. S obzirom da se nauka razvija velikom brzinom, za mnoge predmete na fakultetima je teško objaviti knjigu sa svim relevantnim informacijma, te se učenje često svodi na korišćenje prezentacija ili skripti koje često nisu dovoljno informativne. U okviru ovog projekta, profesorima će biti omogućeno da svoje prezentacije dopune tekstom koji i inače pričaju na predavanjima, te da imaju zvaničnu literaturu iz koje će studenti moći da uče, a koju je izuzetno jednostavno izmeniti u svakom trenutku. U narednom poglavlju opisan je CABUNS sistem i način njegovog korišćenja. Potom su analizirane njegove prednosti i mane, a na kraju je dat pregled zaključaka i pravci daljeg razvoja i unapređenja sistema