Euskara arlo digitalean sustatu eta bermatzeko lanean ari den Euskorpora elkarteko partaide berria da Euskal Herriko Unibertsitatea (EHU). Erabaki horren bidez, euskararen corpus digitala eraikitzeko erronkari ekingo dio unibertsitateak, HiTZ hizkuntza teknologiako zentroa eta Euskara eta Hizkuntza Plangintzarako errektoreordetza buru direla.
EHUren esperientzia oinarri
Igone Zabala errektoreordeak nabarmendu duenez, «funtsezkoa da corpus digitala sortzea eta modu aktiboan garatzea, euskara eraldaketa digitaletik kanpo gera ez dadin». Bere esanetan, EHUk ekarpen garrantzitsua egin dezake, alor horretan metatutako ezagutzari eta corpusgintzan egindako ibilbideari esker.
Gogorarazi dutenez, EHUko Euskara Institutuak 2013an aurkeztu zuen ordura arteko euskarazko corpus handiena, eta geroztik, HiTZ zentroko Ixa taldeak eta Elhuyar Fundazioak batera garatutako Garaterm corpus akademikoak 26 milioi hitz baino gehiago ditu jada.
Abangoardiako hizkuntza teknologiak euskaraz
HiTZ zentroko zuzendari Eneko Agirrek azpimarratu duenez, «EHUk euskarazko hizkuntza teknologia munduko hizkuntza nagusien pare jarri nahi du abangoardiako ikerketaren bidez». Horretarako, ezinbestekotzat jo du corpusen lanketa egokia eta estrategia digital berrietara egokitzea.
HiTZ zentroak ahots eta testu bidezko corpus irekiak garatzen ditu eta eredu libreak sortzen ari da, besteak beste Hugging Face plataforma ezagunean argitaratzen direnak. Bertan eskuragarri daude, adibidez, euskarazko ahotsaren transkripziorako corpus libre handiena (400.000 aldiz jaitsi dena) edo Latxa hizkuntza eredua entrenatzeko erabilitakoa, jada miloi bat deskarga baino gehiago izan dituena.
Enpresentzako aukera berriak
Agirreren hitzetan, «oso garrantzitsua dira corpus libre horiek, edozein enpresak euskara bere produktuetan erraz eta azkar integratu ahal izateko». Euskararen presentzia digitala sendotzeaz gain, horrek enpresei teknologia inklusiboagoa garatzeko aukera ematen die, hizkuntza gutxituen aldeko apustu argi baten bidez.
Etorkizun digital bateratu baten alde
Euskorpora elkarteko kide izatearekin, EHUk urrats sendoa egin du euskararen etorkizun digitalaren alde, eta bere jakintza eta gaitasunak baliatuko ditu euskara XXI. mendeko erronketara eraman eta gizarte osoaren eskura jartzeko.