Back to top

Predstavitev Kolokacijskega slovarja sodobne slovenščine

V torek, 16. oktobra 2018, z začetkom ob 10. uri bosta v Projekcijski dvorani Mestnega muzeja Ljubljana potekala dogodka, posvečena kolokacijam. Najprej bodo sodelavci Centra za jezikovne vire in tehnologije Univerze v Ljubljani predstavili Kolokacijski slovar sodobne slovenščine, nov jezikovni vir za slovenščino, ki v naš prostor uvaja kar nekaj novosti.

Sledil bo dogodek temeljnega raziskovalnega projekta KOLOS - Kolokacije kot temelj jezikovnega opisa: semantični in časovni vidiki (ARRS J6-8255, https://www.cjvt.si/kolos/). Namen dogodka je seznaniti strokovno javnost s cilji in trenutnimi rezultati projekta ter opredeliti njihovo vrednost v luči primerljivih evropskih izkušenj ter nacionalnih prioritet in potreb. Projekt pripravlja nove metode in orodja za luščenje in jezikoslovno analizo kolokacij, zato so še posebej lepo vabljeni tisti, ki bi tovrstne podatke pri svojem delu potrebovali in uporabljali.

Vljudno vabljeni!

 

Program

 

1. del: Kolokacijski slovar sodobne slovenščine

10:00-11:00: Predstavitev Kolokacijskega slovarja sodobne slovenščine (KSSS)

 

2. del: Letni dogodek projekta KOLOS

11:00-12:00 Ana Frankenberg-Garcia (University of Surrey, Velika Britanija): CollocAid

[Opis bo dodan naknadno, posodobljen program pa bo na voljo na povezavi: https://www.cjvt.si/kolos/2018/10/11/predstavitev-kolokacijskega-slovarja-sodobne-slovenscine-in-raziskovalnega-projekta-kolos/]

 

12:00-12:30 Jaka Čibej (FF, IJS, FRI): Priprava učne množice za opredelitev kolokativnosti in druge dejavnosti v projektu KOLOS

Avtomatsko luščenje kolokacij temelji predvsem na izračunu statističnih sopojavitev besed v besedilnem korpusu, vsi tako izluščeni kandidati pa niso ustrezni. Da bi opredelili, kaj je legitimna statistična kolokacija na eni in slovarsko relevantna kolokacija na drugi strani, smo pripravili učno množico kolokacij, ročno razvrščenih v različne kategorije. Rezultati označevanja učne množice so uporabni ne samo za opredelitev kolokativnosti, temveč tudi za identifikacijo najpogostejših težav pri luščenju in s tem potencialnih izboljšav avtomatske metode.

 

12:30-13:00 Nikola Ljubešić (IJS): Frekvencija vs. semantika: što je informativnije za rangiranje kandidata kolokacija?

[Predavanje bo v hrvaščini.] 

Prikazat ćemo niz eksperimenata primjene strojnog učenja na rangiranje kandidata kolokacija koje učimo na skupu podataka proizvedenom unutar projekta KOLOS. Eksperimenti su prvenstveno usmjereni na mjerenje uspješnosti rangiranja u slučaju korištenja (1) mjera supojavljivanja i (2) distribuiranog prikaza značenja riječi. Usporedit ćemo i postupke dubokog učenja s tradicionalnim metodama strojnog učenja.

 

13:00-13:30 Špela Arhar Holdt (FF, FRI): Kako razvrstiti kolokacije v slovarju: uporabniški pogled

Obilje jezikovnih podatkov, ki jih lahko pridobimo z računalniško podprtimi pristopi, je v priročnikih treba razvrstiti na uporabniku prijazen in intuitiven način. V predstavitvi bomo pokazali rezultate raziskave, v kateri so uporabniki kolokacijsko gradivo razvrščali glede na lastne preference - ob tem pa podali tudi opredelitev, katere te preference so.

 

13:30-14:00 Vprašanja in razprava