Adimen artifizialeko tresnek, hala nola ChatGPTk, gero eta presentzia handiagoa dute hainbat arlotan, eta tresna horien gaitasunak etengabe hazten ari dira. Testuak laburtzeko, programak sortzeko edota dokumentuak hizkuntza batetik bestera automatikoki itzultzeko erabiltzen dira, besteak beste. Baina hizkuntzen arteko desoreka nabaria da: ez dira berdin moldatzen hizkuntza handietan eta gutxituetan.
Hizkuntza gutxituen erronka teknologikoa
EHUk jakinarazi duenez, txatboten errendimendua nabarmen jaisten da euskara bezalako hizkuntzetan. Izan ere, sarean eskuragarri dagoen euskarazko edukia oso mugatua da: ingelesez, esaterako, 1.000 aldiz dokumentu gehiago daude, eta gaztelaniaz, 100 aldiz gehiago.
Horrek zaildu egiten du euskaraz kalitatezko eredu automatikoak garatzea, eta, ondorioz, galdera zabaldua da zientzialarien artean: baliabide urriekin, posible al da emaitza onak lortzea?
Berrikuntza teknologikoa HiTZ zentroan
Galdera horri erantzun saiakeran, EHUko HiTZ zentroko ikertzaileek bide berritzaile bat probatu dute, eta emaitza baikorrak lortu dituzte. Eneko Agirre zuzendariak azaldu duenez, «lan berri honekin aurrerapen handia egin da galdera horren baiezko erantzunaren bidean, baina oraindik inkognita izaten jarraitzen du».
Egindako ikerketan euskarazko elkarrizketak kudeatzeko gai den txatbot bat sortu dute, Metak garatutako Llama hizkuntza-eredu irekian oinarrituta.
Metodo berria, esku-lanik gabe
Ohiko bidea eredua eskuz euskarazko datuekin entrenatzea litzateke, baina hori prozesu konplexua eta garestia da. Hori saihesteko, HiTZeko adituek bestelako estrategia batzuk probatu dituzte, eta frogatu dute kalitatezko emaitzak lor daitezkeela eskuzko sarrera masiborik gabe.
Horretarako, ezinbestekoa izan da ereduek aurreko ikaskuntzak ez galtzeko “ahazte katastrofikoa” izeneko arazoari aurre egitea, horri aurre egiteko teknikak erabilita.
Hizkuntza gutxituentzat etorkizun oparoa
Egindako lanak ate berriak irekitzen ditu. Ez bakarrik euskararentzat, baita antzeko testu-bolumen urria duten beste hizkuntzentzat ere. Gainera, metodo hori Llama baino eredu indartsuagoetan ere aplika daiteke, eta horrek aukera ematen du hizkuntza gutxituen presentzia areagotzeko adimen artifizialaren garapenean.
EHUk berretsi du norabide egokian egin dela aurrerapausoa, eta, egindako ikerketa lanari esker, euskarazko tresna teknologikoen kalitatea handitzen jarraitzeko bidea zabaldu dela.