FreeRBMT 2011: Integració d’Apertium a Softcatalà

// 25 de gener de 2011 // Internet, Universitat

La setmana passada es va celebrar a la UOC, a Barcelona,  el FreeRBMT11 (II International Workshop on Free/Open-Source Rule-Based Machine Translation). La primera edició del Workshop la vam organitzar a Alacant des del meu departament a finals de 2009 i on es van presentar 7 articles, la majoria d’ells sobre Apertium i molts d’ells també d’alumnes del GSoC, a més de dues xarrades a càrrec de Kepa Sarasola i Amba Kulkarni.

Enguany, i gràcies a Lluis Villarejo i Mireia Farrús (a la que vaig conèixer en persona i em va dir que era ex de Softcatalà), s’ha pogut celebrar una segona edició a Barcelona. En aquesta ocasió, hi ha hagut més variació en els articles presentats, i l’abast del congrés s’ha mogut més cap a coneixement lingüístic a la traducció automàtica, i no tant centrat en Apertium com l’any anterior.

Fa uns quants mesos, quan es va llançar la web de Softvalencià, vaig instal·lar el traductor Apertium a la web. Per a fer-ho, i gràcies a l’ajuda de Víctor M. Sánchez-Cartagena, vaig instal·lar-lo sota la plataforma ScaleMT, una plataforma que facilita moltíssim la instal·lació escalable de traductors com Apertium (però també d’altres com Matxin). Havent-ho tenint funcionant relativament bé a Softvalencià, durant l’estiu vam fer la prova de foc, i després d’algunes adaptacions de l’entorn, el vam habilitar a Softcatalà com a substitut de l’antic interNOSTRUM. A més, vam implementar algunes eines per a aconseguir millores al traductor de manera semi-automàtica: un sistema de recolecció de paraules desconegudes freqüents, i una interfície on es mostren els suggeriments dels usuaris aliniats amb la frase original i la frase traduïda automàticament, per facilitar la tasca de millora als desenvolupadors del traductor.

Amb tot açò, vam decidir escriure un article, ja que un dels temes del congrés era el de Descripció pràctica d’integració i ús de RBTM, i el cas del traductor de Softcatalà és un exemple paradigmàtic d’ús molt gran d’un traductor automàtic basat en regles. L’article es va titular “A Widely Used Machine Translation Service and its Migration to a Free/Open-Source Solution: the case of Softcatalà“, i es troba publicat sota llicència Creative Commons al repositori obert de la UOC. També el penjaré a la secció de recerca (encara per fer) d’aquesta web, on aniré posant tota la informació relativa a les meues publicacions.

La presentació de l’article va dur associat un torn de preguntes molt productiu, en què moltes millores es van proposar al sistema, tant de cara als usuaris finals, com de cara als mantenidors del traductor. Ara només falta que, poquet a poquet, anem implementant totes eixes millores al servei de Softcatalà. Va estar molt bé l’experiència. Ací podeu veure la presentació de l’article.

Una resposta a “FreeRBMT 2011: Integració d’Apertium a Softcatalà”

  1. Joan ha dit:

    Sembla interessant, almenys a jutjar per la presentació. Quan acaben els exàmens intentaré llegir l’article.

    Salut i enhorabona pel treball!

    Utilitzant Mozilla Firefox Mozilla Firefox 3.6.13 a Mac OS X Mac OS X 10.

Deixeu una resposta