Doctorat

De Investigació

Dreceres ràpides: navegació, cerca

IDEA BÀSICA

Enginyeria inversa de traductors existents per tal d'aconseguir vocabulari.

  • Preparació de diccionaris existents per obtenir paraules de les que es necessita la traducció.
    • Merge dels diccionaris monolingües dels diferents idiomes involucrats en el procés (p.ex. en,ca).


  • Creuar els diccionaris monolingües amb els bilingües, per tal de trobar paraules de les que no tenim la traducció.
    • Buscar una paraula del ca en el ca-en, i si no la trobem, afegir-la a la llista de pendents.
    • Si queden més paraules al diccionari monodix, repetir el pas anterior.


  • Derivar les paraules de la llista de pendents per produir totes les flexions, i generar webs amb els resultats.
    • Utilitzant lt-proc, per a generació, i segons la categoria gramatical de les paraules, obtenir totes les variants de la paraula, encabint-la dins d'un context determinat (p. ex: si és un adjectiu, posar-la junt a det+nom, en totes les combinacions de gènere i nombre).
    • Generar una pàgina web en un servidor d'internet, i procedir a la seva traducció utilizant una eina de traducció online (p. ex. [[1]]
    • Si queden més paraules pendents, repetir els passos anteriors.


  • Analitzar els resultats de les traduccions
    • Si la paraula que obtenim com a candidata en la traducció es troba en l'altre monodix (en)
      • Creem l'entrada per a afegir al bidix amb la correspondència entre els lemes d'ambdues.
    • Si la paraula no es troba en l'altre monodix
      • intentem trobar el paradigma més adeqüat dins del segon monodix (en), basant-nos en les formes que ens ha proporcionat les traduccions
    • Si queden traduccions per analitzar, repetir el pas anterior.
Eines de l'usuari