Entrades etiquetades ‘apertium’

L’hora de les decisions…

// març 26th, 2012 // 10 comentaris » // Personal, Universitat

Ha arribat l’hora de decidir. Possiblement aquesta haja sigut, fins ara, la decissió més important de la meua vida. I l’he presa. En els propers dies deixaré la Universitat, coincidint amb les últimes setmanes del Projecte IMPACT, per a fer un canvi radical a la meva vida.

Departament de Llenguatges i Sistemes InformàticsL’agost de 2007 vaig començar la meva relació “laboral” amb la Universitat (tot i que l’any anterior ja havia fet amb el primer curs del doctorat), primer al Taller Digital, després com a becari d’adjudicació directa al DLSI, i després com a tècnic superior als projectes SCABD (espanyol) i IMPACT (europeu), també al DLSI. A més, durant aquest temps, també he obtingut el DEA.

IMPACT

Aquest últim projecte, IMPACT, és el que més satisfacció m’ha donat. En primer lloc perquè he treballat al costat de gent meravellosa. El meu cap, Rafa Carrasco, una persona increïble que sempre pensa les coses d’una manera que a tu mai et vindria al cap. Al seu costat he aprés moltíssim (va dirigir també la meva tesina), i sé que no podré agrair-li mai prou els consells que m’ha donat al llarg d’aquests mesos (ja anys!) ací al departament. També Isabel Martínez, la meua companya. Directora de l’equip lingüístic IMPACT a la UA (veritat??? :D), ha estat treballant des del principi en el projecte, i ha sigut ella la “culpable” dels bons resultats que hem aconseguit, anotant una gran quantitat de text per crear un lèxic del castellà dels segles XVI i XVII que s’alliberarà pròximament.

El projecte també m’ha dut a visitar ciutats europees com Munich (All-Staff Meeting, abril 2011), Madrid (BNE Demo Day, octubre 2011), Londres (IMPACT Final Conference, octubre 2011), la Haia (reunions a la KB, novembre 2011) i Obergurgl/Innsbruck (desembre 2011), i conèixer moltíssima gent interessant d’arreu d’Europa.

Deixar la Universitat també significarà deixar de compartir el dia a dia amb altres persones que en els últims anys han format part del dia a dia del meu treball: Luca (que vaja bé allà on estigues!), Francis Tyers (a Internet, el trobareu per tot arreu), … i, sobre tot, Víctor i Miquel.

Transducens

Víctor, Miquel i jo vam començar a treballar al departament pràcticament al mateix temps. Hem compartit tres anys llargs d’esmorzars al Don Jamón, de cafés a la Nespresso, de dinars a la “biblioteca d’investigació”, d’enllaços passats pel xat, tweets, odie els dilluns, virus després de caps de setmana, sopars d’empresa, converses metafísiques de ciència i de política, algun que altre viatget, i un llarguíssim etcètera basat en, sobre tot, frikades. Xicons, vos trobaré a faltar moltíssim. Segur que vos va tot bé i llegiu les vostres tesis en pocs mesos.

I no puc oblidar a Juan Antonio, Felipe i Mikel. Els profes, junt a Rafa, del grup Transducens. Ha estat tot un plaer compartir reunions amb vosaltres. M’heu donat una lliçó fonamental en la vida: estima allò que fas. Vosaltres ho feu, i es nota: Sou uns apassionats de la traducció automàtica, i realment treballeu per aconseguir que les màquines ens ajuden amb la barbaritat d’informació en diverses llengües que hi ha escampada pel món. Records també Gema i Sergio, de Prompsit (empresa spin-off del grup d’investigació), que m’han ajudat sempre que m’ha fet falta.

Però no és només la feina el que deixaré a la Sant Vicent. També deixe un pis i una gent amb la que he viscut els últims anys. Héctor i Isma, amics, hem compartit molts dinars i sopars junts, moltes cerveses i partits de futbol. Sé que ens continuarem veient, l’amistat que hem fet segur que serà per a molts anys, però a partir d’ara les nostres trobades seran més escasses. Junt a ells, altres companys que han passat durant els anys: Andrés, Robert, Joan, Pablo… encantat d’haver-vos conegut, i haver viscut amb vosaltres.

I no només canvie de feina, i de lloc on viure entre setmana. La meua vida canvia totalment, anant-me’n a viure de manera permanent a Barcelona. No tornaré cada divendres a casa, veient Benissa al passar els túnels del Mascarat, a dinar amb els meus pares. Tampoc no podré dinar amb la meua germana i ma uelo tots els dissabtes la paella que prepara mon pare, amb el trosset de xocolate de rigor en acabar. També s’han acabat els assajos de banda cada divendres per la nit, les reunions de moros cada mes, les classes d’oboè i els assajos morrallers dels dissabtes. No voré tant a la família ni als amics (Robert, ja no em fa falta el cuarto :D). I, sobre tot, no voré (espere que per poc de temps) a Noelia cada cap de setmana. I açò últim em costarà molt.

Fa poc em van dir que era hora de passar totalment a la vida adulta. I crec que aquest canvi em permetrà fer-ho. Deixe moltes coses enrere, algunes temporalment, altres potser per sempre, però també se m’obrin moltes coses davant. Una nova ciutat, més gran i atractiva, nova gent, nova feina, nous reptes… Estic trist, però al mateix temps molt il·lusionat. És un encontre d’emocions difícil d’expressar. Estic massa acostumat al meu poble i a la meua gent, i sé que em costarà adaptar-me al nou entorn. Però açò segur que em fa valorar, encara més, la sort que he tingut durant tots aquests anys.

Barcelona, allà vaig.

FreeRBMT 2011: Integració d’Apertium a Softcatalà

// gener 25th, 2011 // 1 comentari // Internet, Universitat

La setmana passada es va celebrar a la UOC, a Barcelona,  el FreeRBMT11 (II International Workshop on Free/Open-Source Rule-Based Machine Translation). La primera edició del Workshop la vam organitzar a Alacant des del meu departament a finals de 2009 i on es van presentar 7 articles, la majoria d’ells sobre Apertium i molts d’ells també d’alumnes del GSoC, a més de dues xarrades a càrrec de Kepa Sarasola i Amba Kulkarni.

Enguany, i gràcies a Lluis Villarejo i Mireia Farrús (a la que vaig conèixer en persona i em va dir que era ex de Softcatalà), s’ha pogut celebrar una segona edició a Barcelona. En aquesta ocasió, hi ha hagut més variació en els articles presentats, i l’abast del congrés s’ha mogut més cap a coneixement lingüístic a la traducció automàtica, i no tant centrat en Apertium com l’any anterior.

Fa uns quants mesos, quan es va llançar la web de Softvalencià, vaig instal·lar el traductor Apertium a la web. Per a fer-ho, i gràcies a l’ajuda de Víctor M. Sánchez-Cartagena, vaig instal·lar-lo sota la plataforma ScaleMT, una plataforma que facilita moltíssim la instal·lació escalable de traductors com Apertium (però també d’altres com Matxin). Havent-ho tenint funcionant relativament bé a Softvalencià, durant l’estiu vam fer la prova de foc, i després d’algunes adaptacions de l’entorn, el vam habilitar a Softcatalà com a substitut de l’antic interNOSTRUM. A més, vam implementar algunes eines per a aconseguir millores al traductor de manera semi-automàtica: un sistema de recolecció de paraules desconegudes freqüents, i una interfície on es mostren els suggeriments dels usuaris aliniats amb la frase original i la frase traduïda automàticament, per facilitar la tasca de millora als desenvolupadors del traductor.

Amb tot açò, vam decidir escriure un article, ja que un dels temes del congrés era el de Descripció pràctica d’integració i ús de RBTM, i el cas del traductor de Softcatalà és un exemple paradigmàtic d’ús molt gran d’un traductor automàtic basat en regles. L’article es va titular “A Widely Used Machine Translation Service and its Migration to a Free/Open-Source Solution: the case of Softcatalà“, i es troba publicat sota llicència Creative Commons al repositori obert de la UOC. També el penjaré a la secció de recerca (encara per fer) d’aquesta web, on aniré posant tota la informació relativa a les meues publicacions.

La presentació de l’article va dur associat un torn de preguntes molt productiu, en què moltes millores es van proposar al sistema, tant de cara als usuaris finals, com de cara als mantenidors del traductor. Ara només falta que, poquet a poquet, anem implementant totes eixes millores al servei de Softcatalà. Va estar molt bé l’experiència. Ací podeu veure la presentació de l’article.

Trobada anual de Softcatalà 2010

// desembre 29th, 2010 // 3 comentaris » // Internet, Llengua, Personal

Fa ja uns quants anys que forme part de Softcatalà.Va ser a finals d’octubre de l’any 2004 que Toni Hermoso va proposar a la resta de membres que jo hi formés part. des de la primavera d’aquell mateix any havia estat treballant per traduir algunes extensions del Firefox. I gràcies a aquesta formar part de Softcatalà vaig migrar definitivament cap a Linux des del benvolgut (en aquell moment) XP. Poc després vaig conèixer en persona a Toni Hermoso, en una visita a BCN a casa Sílvia durant les festes de la Mercè de 2005. I no va ser fins a l’any passat, durant la I Jornada de difusió de programari informatic en valencià, que vaig conèixer també en persona a Pau Iranzo.

Amb tot açò vull dir que la meva relació amb Softcatalà havia sigut pràcticament tota virtual, a través d’Internet. Tot i que en molts moments Internet ajuda a reduir la distància entre membres d’un grup, mai no es té una relació igual que quan ja coneixes personalment a la gent.

I el passat 18 de desembre, en la primera trobada anual de Softcatalà, n’he conegut a molts d’ells. Es tractava de fer una reunió en la que mostrar una visió global dels treballs que s’havien fet des dels diferents projectes de Softcatalà, així com un repàs de les estadístiques de visites a la web, a l’estat dels comptes i als reptes de futur, abans d’anar al ja tradicional Sopar de Nadal de Softcatalà.

Tot i que l’agenda era molt optimista, i que ens vam haver de deixar unes quants coses per parlar, el balanç global de la reunió va ser moooolt positiu. Entre altres coses, vam poder explicar als companys de Catalunya la situació de la llengua ací al País Valencià i les tasques que des de Softvalencià hem de fer per normalitzar la situació, gràcies a una presentació molt bona de Pau Iranzo i Robert Escolano, que podeu veure a continuació.

Jo, per la meua part, vaig contar una miqueta la implantació d’Apertium com a traductor a la web de Softcatalà que vaig fer aquest estiu, i quins són els propers passos a fer en aquest aspecte. Referent a aquesta implantació, i degut a l’altíssim volum de traduccions que es gestionen des de la web de Softcatalà, Víctor (company a la UA) i jo hem escrit un petit article per al FreeRBMT 2011 que se celebrarà a finals de gener a BCN.

Després de la trobada vam anar a sopar a Can Culleretes, i en acabant vam anar a un irlandés a fer-nos un parell de Guiness i continuar xarrant de programari lliure, llengua, política, esports,… vaja, un repàs general a tot.

Robert i jo vam dormir al pis de Pau, a Gràcia, i diumenge de matí vam anar els tres a esmorzar a la xocolateria la Nena abans d’agafar l’Euromed de tornada a València.

Les conclusions de la trobada? Dos: La primera, que a Softcatalà un grup reduït de gent fa una feina espectacular amb molt pocs recursos, de manera que vull convidar a tots a que col·laboreu dins les vostres possibilitats en el que pugueu. La segona, que si mai vaig a viure a Barcelona, vull que siga a un lloc com Gràcia (i això que vam vore ben poc!) 😀

Softvalencià

// març 23rd, 2010 // 6 comentaris » // Informàtica, Internet, Llengua, Personal

Softvalencià

Softvalencià

Avuí ha vist la llum Softvalencià. Per tal explicar de què es tracta d’una manera ràpida i senzilla, podríem dir que es tracta d’una campanya (acompanyada d’un lloc web) per potenciar l’ús de la llengua en l’àmbit de les noves tecnologies al País Valencià.

La iniciativa naix d’un grup de membres valencians de Softcatalà (entre els que destaquen, per la tasca que han fet, sense oblidar a tots els altres, Pau Iranzo i Robert Escolano) i la col·laboració d’Escola Valenciana, per tal de resoldre el greu dèficit que existeix en l’ús del valencià a l’ordinador: són molt pocs els ordinadors que, ací al País Valencià, estan configurats en valencià (com a exemple, no arriba a l’1,5% de visites a Infobenissa des d’un Windows+InternetExplorer amb el navegador configurat en valencià).

Tot i que el percentatge augmenta quan comencem a utilitzar programari lliure (32% en el cas de Windows-Firefox, o percentatges majors en el cas de Linux), cal una tasca important de promoció per arribar a nivells que, almenys, no facen vergonya. I aquesta tasca s’ha de fer, sense complexos, enfocada per als valencians.

Quan dic sense complexos vull dir sense renunciar als avantatges que tenim per tindre una llengua mitjanament potent (encara que minoritzada) amb 10 milions de parlants potencials, coneguda a la majoria dels llocs com a català, però sense renunciar tampoc a les particularitats que els valencians li aportem (entre elles, el nom que li solem donar a la criatura: valencià).

La pàgina web inclou diverses coses, entre les que es troben tutorials per tal d’ajudar-nos a configurar el nostre equip i un recull de programari en valencià (disponible també al Rebost de Softcatalà, com el navegador Firefox, el gestor de correu Thunderbird, els pedaços per al Windows i l’Office, etc).

Però personalment destacaria les eines lingüístiques que contempla: corrector i traductor (com els existents a Softcatalà) però amb suport per a les versions valencianes: doble accentuació i lèxic autòcton al corrector, i la generació de formes valencianes per al parell castellà ? valencià del traductor. Aquesta instal·lació del traductor servirà, a més, com a plataforma per a provar Apertium de cara a implantar-lo de manera definitiva a Softcatalà. Una vegada estabilitzat el sistema, vull veure si aprofite i el pose també a Infobenissa, per tal d’oferir un nou servei útil per a la gent del poble.

En definitiva, del que es tracta és d’augmentar l’ús de la nostra llengua en les noves tecnologies. Espere que tinguem èxit amb la iniciativa!

Borrellons blogosfèrics…
... quin cacau!

// juny 9th, 2008 // 2 comentaris » // Internet, Personal

Últimament, la part de la blogosfera que acostume a seguir ha canviat significativament.

Després de reduir moooolt els fils que tenia al Reader, i ara de fer la neteja 2.1 de què vaig parlar en eixa entrada, se m’ha quedat en només una cinquantena de blogs. I segur que encara en llevaré alguns més 😉

Defuncions…

Però no només quins blogs seguisc han canviat, sinó que també han canviat alguns d’ells per dins. Un dels blogs que més m’agradava, “No hi havia a València”, s’acabava amb l’anunci del seu autor, Felip (orxater), un jove benissenc.

Un altre que també està off és el de la Mirada Crítica. Després del seu tercer aniversari, no ha tornat a escriure res més.

Resurreccions…

Per contra, resurreccions també n’han hagut. A destacar les dels companys de Softcatalà Gil i Sílvia, que últimament tenen moltes ganes d’escriure.

Naixements…

Enrique Benimeli, company al doctorat, ha començat un nou projecte de blog. Encara és molt recent, però segur que ens mostra coses interessants. Per cert, Enrique ha començat també un projecte interessat basat en les dades lingüístiques d’Apertium: TinyLex. TinyLex és un programa en J2ME que permet consultar diccionaris bilingües al mòbil. Mola! 😉

Borrellons…

Finalment, un dels blogs que més il·lusió m’ha fet que es començaren, el de la meua germana. Amb el suggerent nom de Els borrellons del melic, ens apropa un punt de vista molt especial, el seu 😀 Es tracta d’un blog personal, donant importància al terme personal: coses del dia a dia, família, amics… però també política, religió i altres coses són les que de segur ens parla. Belén, sort i a escriure.

Per cert, el tema del blog, que encara no està acabat, l’he fet a partir del Garden Theme i una modificació del mateix, [des]enfocada.

DEA, allà anem…
... esperem arribar

// març 6th, 2008 // No hi ha comentaris » // Universitat

Després de molts mesos pensant-m’ho, analitzant idees, fent xicotetes proves… es pot dir que la màquina ja està en funcionament.

Encara estic al Taller Digital de la Universitat d’Alacant, i fins a final de més estaré encara a jornada completa, però només comence abril ja estaré només mitja jornada, i això em permetrà tirar-li moltes mes hores al doctorat.

La meva idea és anar ben matinet al TD, i quan haja fet les hores que toquen, arrear cap al laboratori de becaris del DLSI per a fer feina allí. Em conec massa, i sé que ací a casa faria el gos bona cosa!

Però he decidit que ja està bé, que no es pot anar fent les coses tan a poc a poc, i ahir, abans del partit del Madrid (per cert, Roma oeoeoe, Roma oeoeoe….) vaig estar parlant amb Fran i amb Gema, els dos treballadors de Prompsit (i molt bona gent) i vaig començar a aclarir molt millor les meues idees.

Avuí ha tocat començar a muntar el sistema en sí, que aniré desvelant en posteriors capítols d’aquesta nova sèrie, però he hagut de parar perquè he trobat un “bug” al paquet fr-ca d’Apertium, que necessite per al meu sistema.

Amb els meus treballs no vaig a erradicar la fam del món, ni trobar la cura al càncer o la SIDA, però si aconseguisc colaborar en facilitar d’alguna manera la comunicació entre la gent de diversos països, estaré més que satisfet.

Ara toca netejar la taula de papers escampats, començar a muntar un bon registre de referències bibliogràfiques, i a treballar!

Seguirem informant…