FreeRBMT 2011: Integració d’Apertium a Softcatalà

// 25 de gener de 2011 // Internet, Universitat

Xavi IvarsSi vols saber una miqueta més sobre mi, estàs en el lloc indicat.

El meu nom complet és Xavier Ivars i Ribes, i sóc de la localitat de Benissa, un poble de la comarca de la Marina Alta, al País Valencià.

Estudiant i treballant…

Després d’estudiar el batxillerat a l’Institut Josep Iborra, ací a Benissa, vaig començar la carrera d’Enginyeria en Informàtica a la Universitat d’Alacant l’any 2001, anant-me’n a viure a Sant Vicent del Raspeig. Durant 5 anys vaig viure allí, coneixent a molt bons amics, i aprenent molt.

Després d’un any de nou al poble, treballant a Connecta Front-Back, i  estudiant del doctorat Aplicacions de la Informàtica, vaig tornar a la Universitat, concretament al Taller Digital, com a programador. I després d’un altre any, vaig entrar com a Tècnic del Projecte SCABD al Grup Transducens del DLSI. En aquest context vaig presentar la meva tesina sobre models de paraules.

Actualment sóc Tècnic d’un altre projecte, ara Europeu, i també relacionat amb les Biblioteques Digitals: el Projecte IMPACT.

QR amb la meva targeta de contacte

QR amb la meva targeta de contacte

Un poc “friki”…

La meva afició a tot allò relacionat amb Internet i la resta de tecnologies de la informació i la comunicació està relacionada amb allò que he estudiat, però també amb la inquietud de donar a conèixer el meu poble a tot el món. Amb eixa intenció vaig començar a treballar junt a Joanba a Infobenissa, un portal informatiu de la localitat. També he fet algunes pàgines web per a empreses, per a traure’m algun duret, que sempre fa falta.

Musiqueta…

Una altra de les meues aficions és la música. Des de ben menut m’ha agradat, i actualment toque l’oboè a la Banda de Música del poble. També he tocat en algunes ocasions la dolçaina, instrument típic valencià, a la Colla Pere Bigot, i el projecte xaranguer de la Morralla està pendent 😉 Però una cosa tinc clara: el meu instrument és l’oboè.

Parlant de tot…

També en l’àmbit tecnològic, però també lingüístic, forme part de Softcatalà, associació sense ànim de lucre que es dedica a localitzar (traduir i adaptar) programari al català. Em dedique fonamentalment al Projecte Mozilla, amb el navegador Firefox i el gestor de correu Thunderbird, traduint extensions.

Si vols saber alguna cosa més de mi, pots utilitzar la pàgina de contacte 😉
Xavi IvarsSi vols saber una miqueta més sobre mi, estàs en el lloc indicat.

El meu nom complet és Xavier Ivars i Ribes, i sóc de la localitat de Benissa, un poble de la comarca de la Marina Alta, al País Valencià.

Estudiant i treballant…

Després d’estudiar el batxillerat a l’Institut Josep Iborra, ací a Benissa, vaig començar la carrera d’Enginyeria en Informàtica a la Universitat d’Alacant l’any 2001, anant-me’n a viure a Sant Vicent del Raspeig. Durant 5 anys vaig viure allí, coneixent a molt bons amics, i aprenent molt.

Després d’un any de nou al poble, treballant a Connecta Front-Back, i  estudiant del doctorat Aplicacions de la Informàtica, vaig tornar a la Universitat, concretament al Taller Digital, com a programador. I després d’un altre any, vaig entrar com a Tècnic del Projecte SCABD al Grup Transducens del DLSI. En aquest context vaig presentar la meva tesina sobre models de paraules.

Actualment sóc Tècnic d’un altre projecte, ara Europeu, i també relacionat amb les Biblioteques Digitals: el Projecte IMPACT.

QR amb la meva targeta de contacte

QR amb la meva targeta de contacte

Un poc “friki”…

La meva afició a tot allò relacionat amb Internet i la resta de tecnologies de la informació i la comunicació està relacionada amb allò que he estudiat, però també amb la inquietud de donar a conèixer el meu poble a tot el món. Amb eixa intenció vaig començar a treballar junt a Joanba a Infobenissa, un portal informatiu de la localitat. També he fet algunes pàgines web per a empreses, per a traure’m algun duret, que sempre fa falta.

Musiqueta…

Una altra de les meues aficions és la música. Des de ben menut m’ha agradat, i actualment toque l’oboè a la Banda de Música del poble. També he tocat en algunes ocasions la dolçaina, instrument típic valencià, a la Colla Pere Bigot, i el projecte xaranguer de la Morralla està pendent 😉 Però una cosa tinc clara: el meu instrument és l’oboè.

Parlant de tot…

També en l’àmbit tecnològic, però també lingüístic, forme part de Softcatalà, associació sense ànim de lucre que es dedica a localitzar (traduir i adaptar) programari al català. Em dedique fonamentalment al Projecte Mozilla, amb el navegador Firefox i el gestor de correu Thunderbird, traduint extensions.

Si vols saber alguna cosa més de mi, pots utilitzar la pàgina de contacte 😉
La setmana passada es va celebrar a la UOC, a Barcelona,  el FreeRBMT11 (II International Workshop on Free/Open-Source Rule-Based Machine Translation). La primera edició del Workshop la vam organitzar a Alacant des del meu departament a finals de 2009 i on es van presentar 7 articles, la majoria d’ells sobre Apertium i molts d’ells també d’alumnes del GSoC, a més de dues xarrades a càrrec de Kepa Sarasola i Amba Kulkarni.

Enguany, i gràcies a Lluis Villarejo i Mireia Farrús (a la que vaig conèixer en persona i em va dir que era ex de Softcatalà), s’ha pogut celebrar una segona edició a Barcelona. En aquesta ocasió, hi ha hagut més variació en els articles presentats, i l’abast del congrés s’ha mogut més cap a coneixement lingüístic a la traducció automàtica, i no tant centrat en Apertium com l’any anterior.

Fa uns quants mesos, quan es va llançar la web de Softvalencià, vaig instal·lar el traductor Apertium a la web. Per a fer-ho, i gràcies a l’ajuda de Víctor M. Sánchez-Cartagena, vaig instal·lar-lo sota la plataforma ScaleMT, una plataforma que facilita moltíssim la instal·lació escalable de traductors com Apertium (però també d’altres com Matxin). Havent-ho tenint funcionant relativament bé a Softvalencià, durant l’estiu vam fer la prova de foc, i després d’algunes adaptacions de l’entorn, el vam habilitar a Softcatalà com a substitut de l’antic interNOSTRUM. A més, vam implementar algunes eines per a aconseguir millores al traductor de manera semi-automàtica: un sistema de recolecció de paraules desconegudes freqüents, i una interfície on es mostren els suggeriments dels usuaris aliniats amb la frase original i la frase traduïda automàticament, per facilitar la tasca de millora als desenvolupadors del traductor.

Amb tot açò, vam decidir escriure un article, ja que un dels temes del congrés era el de Descripció pràctica d’integració i ús de RBTM, i el cas del traductor de Softcatalà és un exemple paradigmàtic d’ús molt gran d’un traductor automàtic basat en regles. L’article es va titular “A Widely Used Machine Translation Service and its Migration to a Free/Open-Source Solution: the case of Softcatalà“, i es troba publicat sota llicència Creative Commons al repositori obert de la UOC. També el penjaré a la secció de recerca (encara per fer) d’aquesta web, on aniré posant tota la informació relativa a les meues publicacions.

La presentació de l’article va dur associat un torn de preguntes molt productiu, en què moltes millores es van proposar al sistema, tant de cara als usuaris finals, com de cara als mantenidors del traductor. Ara només falta que, poquet a poquet, anem implementant totes eixes millores al servei de Softcatalà. Va estar molt bé l’experiència. Ací podeu veure la presentació de l’article.

Una resposta a “FreeRBMT 2011: Integració d’Apertium a Softcatalà”

  1. Joan ha dit:

    Sembla interessant, almenys a jutjar per la presentació. Quan acaben els exàmens intentaré llegir l’article.

    Salut i enhorabona pel treball!

    Utilitzant Mozilla Firefox Mozilla Firefox 3.6.13 a Mac OS X Mac OS X 10.

Deixeu una resposta