Garsynas LIEPA-2

Lietuvių šnekos garsynas LIEPA-2 – fonetiškai reprezentatyvus, struktūrizuotas duomenų (garso įrašų ir jų anotacijų) rinkinys, skirtas šnekos technologijų moksliniams tyrimams bei elektroninių paslaugų kūrimui.
  • Garsynas yra 1000 val. trukmės.
  • Garso įrašų charakteristikos: formatas – .wav, diskretizavimo dažnis – 16 kHz,  kvantavimas – 16 bitų, kanalų skaičius – 1.
  • Garsyną sudaro garso įrašai (formatas .wav) juos atitinkančios anotacijos (formatas .eaf) ir <papildoma informacija>.
  • Diktorių skaičius: 2621 (56 proc. moterų ir 44 proc. vyrų). Diktorių pasiskirstymas amžiaus grupėse: iki 12 m. amžiaus grupėje 8 proc. diktorių, 13-17 m. – 3 proc., 18-25 m. – 18 proc., 26-60 m. – 61 proc. ir 60-ies ir daugiau m. – 10 proc.
  • Skaitytinės šnekos yra 91 proc. ir spontaninės šnekos – 9 proc.
  • Audio knygų įrašų yra 3 proc., diktofonu surinktų įrašų – 28 proc., telefoninių įrašų – 2 proc., studijoje surinktų įrašų – 62 proc., televizijos laidų įrašų – 3 proc., radijo laidų įrašų – 2 proc.
  • Garso įrašai: žodžių ir frazių sekos, skaitytinės ir spontaninės šnekos tipų tekstas. Garsyno tekstai apima: lietuvių ir užsienio autorių knygų ištraukas, aktualias naujienas, vaikams skirtus tekstus, pasakas ir mitus, tekstus apie meną (grafika, muzika, spektakliai, filmai), politiką, mokyklą, psichologiją, prisiminimus ir pasakojimus, šalis ir vietoves, receptus, istoriją, gamtą, automobilius, informacines technologijas, sportą, įvairių daiktų atsiradimą ir pan.
Dėl didelės apimties, garsynas tiesioginiam atsisiuntimui nėra pateikiamas. Susidomėjusius garsynu, prašome kreiptis į garsyno kūrėjus adresu gediminas.navickas[eta]mif.vu.lt
Lietuvių šnekos garsynas LIEPA-2 platinamas pagal CC BY licenciją, ją galite rasti čia >>>
Panaudojus garsyną kitų produktų sukūrimui, prašome paminėti savo produkto aprašyme, kad garsynas buvo sukurtas Vilniaus universitete, vykdant projektą „Lietuvių šneka valdomų paslaugų plėtra – LIEPA 2“.