Euskara|Español|English
manuscrito
|| TESITEK ||
BONAPARTE ONDAREKO ESKUIZKRIBUAK - FONDO BONAPARTE
Bonaparte

Metodologia

Aldaketa grafiko-fonetiko guztiak bildu ondoren, hizkuntz markaketarako jokabide nagusiak ezarri ziren. Beti ere, kontutan izanik analisi morfosintaktikoak automatizazioa erdietsi nahi duela fenomeno bereizgarriak etiketatzeko bilakabidean, kasu bakoitzean haien balioa eta betetzen duten funtzioa begiratuz.

Gertakizun morfologikoak jaso eta tratatzeko jarraitu den metodologia hau izan da:
  1. Izen eta aditz sistemetarako zenbait flexio eta jokabide eredu definitu, euskalki eta azpieuskalki ezberdinak kontutan hartuz.
  2. Testu bakoitzean agertzen diren lexemak eskuz lematizatu eta, ondoren, dagozkien ereduekin lotu. Modu honetan, elementu bakoitzaren flexio eta jokabideko forma guztiak lortzen dira, behar bezala sailkatuta eta gainerako informazioarekin.
  3. Adizkiei dagokienez, testuetan ageri diren kasuetan oinarritzen da, ez haien berregintzan, izan ere, azken metodo honek paradigma guztiak osatuko lituzkeen arren, analogia baliatzera behartuko luke eta, beraz, formen fidagarritasuna urrituko litzateke.
  4. Etiketatze linguistikoa bi fasetan burutua da. Lehenengoan, atributuen oinarrizko zerrenda bat prestatu da; bigarrenean, atributu horiek kategorien arabera banatu dira.
Markaketarako etiketen errepertorio propioa garatu da XML sintaxiari jarraituz.

Maila sintaktikoan jarraitu den metodologiaren garapena aurrekotik bereizten da. Oraingoz ez da azaltzen, osatzen eta probatzen baitago.

Bestalde, proiektuaren zailtasun handiak aurrera arretaz egitera eta analisi-sail laburretan aritzera behartzen du. Ezarri den murrizketa bat euskalkiena izan da. Maila morfologikoan dialekto guztiekin aldi berean lan egin bada ere, sintaktikoak, berez konplexua baita, ahaleginak euskalki bakarrean batzera behartzen du. Horrela, orain bizkaieraren ekialdeko azpieuskalkia garatzen ihardun da eta hurrengo faseetan beste euskalkiekin jarraituko da.

Maila morfologikoan ere badira oraino bete beharreko hutsune aunitz, akatsak zuzentzeko eta formula berriak probatzeko. Hala ere, lortu diren emaitzek egitasmoa norabide onean doala erakusten dute eta komunitate zientifikoarekin parteka daitezkeela uste dugu.
 
Testuen hautaketa|Analizatzaile morfologikoa|Analizatzaile sintaktikoa|Glosarioa|Testuen erkaketa|Batueratik
Bizkaiko Foru Aldundia - Diputación Foral de Bizkaia UNIVERSIDAD DE DEUSTO · DEUSTUKO UNIBERTSITATEA