Arxiu de Universitat

L’hora de les decisions…

// març 26th, 2012 // 10 comentaris » // Personal, Universitat

Ha arribat l’hora de decidir. Possiblement aquesta haja sigut, fins ara, la decissió més important de la meua vida. I l’he presa. En els propers dies deixaré la Universitat, coincidint amb les últimes setmanes del Projecte IMPACT, per a fer un canvi radical a la meva vida.

Departament de Llenguatges i Sistemes InformàticsL’agost de 2007 vaig començar la meva relació “laboral” amb la Universitat (tot i que l’any anterior ja havia fet amb el primer curs del doctorat), primer al Taller Digital, després com a becari d’adjudicació directa al DLSI, i després com a tècnic superior als projectes SCABD (espanyol) i IMPACT (europeu), també al DLSI. A més, durant aquest temps, també he obtingut el DEA.

IMPACT

Aquest últim projecte, IMPACT, és el que més satisfacció m’ha donat. En primer lloc perquè he treballat al costat de gent meravellosa. El meu cap, Rafa Carrasco, una persona increïble que sempre pensa les coses d’una manera que a tu mai et vindria al cap. Al seu costat he aprés moltíssim (va dirigir també la meva tesina), i sé que no podré agrair-li mai prou els consells que m’ha donat al llarg d’aquests mesos (ja anys!) ací al departament. També Isabel Martínez, la meua companya. Directora de l’equip lingüístic IMPACT a la UA (veritat??? :D), ha estat treballant des del principi en el projecte, i ha sigut ella la “culpable” dels bons resultats que hem aconseguit, anotant una gran quantitat de text per crear un lèxic del castellà dels segles XVI i XVII que s’alliberarà pròximament.

El projecte també m’ha dut a visitar ciutats europees com Munich (All-Staff Meeting, abril 2011), Madrid (BNE Demo Day, octubre 2011), Londres (IMPACT Final Conference, octubre 2011), la Haia (reunions a la KB, novembre 2011) i Obergurgl/Innsbruck (desembre 2011), i conèixer moltíssima gent interessant d’arreu d’Europa.

Deixar la Universitat també significarà deixar de compartir el dia a dia amb altres persones que en els últims anys han format part del dia a dia del meu treball: Luca (que vaja bé allà on estigues!), Francis Tyers (a Internet, el trobareu per tot arreu), … i, sobre tot, Víctor i Miquel.

Transducens

Víctor, Miquel i jo vam començar a treballar al departament pràcticament al mateix temps. Hem compartit tres anys llargs d’esmorzars al Don Jamón, de cafés a la Nespresso, de dinars a la “biblioteca d’investigació”, d’enllaços passats pel xat, tweets, odie els dilluns, virus després de caps de setmana, sopars d’empresa, converses metafísiques de ciència i de política, algun que altre viatget, i un llarguíssim etcètera basat en, sobre tot, frikades. Xicons, vos trobaré a faltar moltíssim. Segur que vos va tot bé i llegiu les vostres tesis en pocs mesos.

I no puc oblidar a Juan Antonio, Felipe i Mikel. Els profes, junt a Rafa, del grup Transducens. Ha estat tot un plaer compartir reunions amb vosaltres. M’heu donat una lliçó fonamental en la vida: estima allò que fas. Vosaltres ho feu, i es nota: Sou uns apassionats de la traducció automàtica, i realment treballeu per aconseguir que les màquines ens ajuden amb la barbaritat d’informació en diverses llengües que hi ha escampada pel món. Records també Gema i Sergio, de Prompsit (empresa spin-off del grup d’investigació), que m’han ajudat sempre que m’ha fet falta.

Però no és només la feina el que deixaré a la Sant Vicent. També deixe un pis i una gent amb la que he viscut els últims anys. Héctor i Isma, amics, hem compartit molts dinars i sopars junts, moltes cerveses i partits de futbol. Sé que ens continuarem veient, l’amistat que hem fet segur que serà per a molts anys, però a partir d’ara les nostres trobades seran més escasses. Junt a ells, altres companys que han passat durant els anys: Andrés, Robert, Joan, Pablo… encantat d’haver-vos conegut, i haver viscut amb vosaltres.

I no només canvie de feina, i de lloc on viure entre setmana. La meua vida canvia totalment, anant-me’n a viure de manera permanent a Barcelona. No tornaré cada divendres a casa, veient Benissa al passar els túnels del Mascarat, a dinar amb els meus pares. Tampoc no podré dinar amb la meua germana i ma uelo tots els dissabtes la paella que prepara mon pare, amb el trosset de xocolate de rigor en acabar. També s’han acabat els assajos de banda cada divendres per la nit, les reunions de moros cada mes, les classes d’oboè i els assajos morrallers dels dissabtes. No voré tant a la família ni als amics (Robert, ja no em fa falta el cuarto :D). I, sobre tot, no voré (espere que per poc de temps) a Noelia cada cap de setmana. I açò últim em costarà molt.

Fa poc em van dir que era hora de passar totalment a la vida adulta. I crec que aquest canvi em permetrà fer-ho. Deixe moltes coses enrere, algunes temporalment, altres potser per sempre, però també se m’obrin moltes coses davant. Una nova ciutat, més gran i atractiva, nova gent, nova feina, nous reptes… Estic trist, però al mateix temps molt il·lusionat. És un encontre d’emocions difícil d’expressar. Estic massa acostumat al meu poble i a la meua gent, i sé que em costarà adaptar-me al nou entorn. Però açò segur que em fa valorar, encara més, la sort que he tingut durant tots aquests anys.

Barcelona, allà vaig.

L’amistat i les dones

// abril 6th, 2011 // No hi ha comentaris » // Cites, Llengua, Universitat

Aquest matí a la feina, mentre revisava la paraula conservar a la transcripció del “Diccionario de la lengua castellana, en que se explica el verdadero sentido de las voces, su naturaleza y calidad, con las phrases o modos de hablar, los proverbios o refranes, y otras cosas convenientes al uso de la lengua“, més conegut com a Diccionario de Autoridades, he trobat una frase curiosa i que m’ha fet gràcia. Així que he decidit afegir-la al meu recull de frases i citacions.

Abans de llegir-la, cal tindre en compte dues coses: el masclisme imperant en l’època, de manera que qualsevol cosa que afectara a les persones (com en aquest cas, l’amistat) es referia gairebé exclusivament als homes (les dones eren considerades éssers inferiors, si em permeteu l’expressió), i també que la frase està en castellà antic (‘ſ’‘s’):

Los que conſervan con las mugéres las amiſtádes mucho tiempo no las conſervan por que las quieren ſino porque las quiſieron

Juan de Zabaleta, en les col·leccions “El dia de fiesta”

FreeRBMT 2011: Integració d’Apertium a Softcatalà

// gener 25th, 2011 // 1 comentari // Internet, Universitat

La setmana passada es va celebrar a la UOC, a Barcelona, el FreeRBMT11 (II International Workshop on Free/Open-Source Rule-Based Machine Translation). La primera edició del Workshop la vam organitzar a Alacant des del meu departament a finals de 2009 i on es van presentar 7 articles, la majoria d’ells sobre Apertium i molts d’ells també d’alumnes del GSoC, a més de dues xarrades a càrrec de Kepa Sarasola i Amba Kulkarni.

Enguany, i gràcies a Lluis Villarejo i Mireia Farrús (a la que vaig conèixer en persona i em va dir que era ex de Softcatalà), s’ha pogut celebrar una segona edició a Barcelona. En aquesta ocasió, hi ha hagut més variació en els articles presentats, i l’abast del congrés s’ha mogut més cap a coneixement lingüístic a la traducció automàtica, i no tant centrat en Apertium com l’any anterior.

Fa uns quants mesos, quan es va llançar la web de Softvalencià, vaig instal·lar el traductor Apertium a la web. Per a fer-ho, i gràcies a l’ajuda de Víctor M. Sánchez-Cartagena, vaig instal·lar-lo sota la plataforma ScaleMT, una plataforma que facilita moltíssim la instal·lació escalable de traductors com Apertium (però també d’altres com Matxin). Havent-ho tenint funcionant relativament bé a Softvalencià, durant l’estiu vam fer la prova de foc, i després d’algunes adaptacions de l’entorn, el vam habilitar a Softcatalà com a substitut de l’antic interNOSTRUM. A més, vam implementar algunes eines per a aconseguir millores al traductor de manera semi-automàtica: un sistema de recolecció de paraules desconegudes freqüents, i una interfície on es mostren els suggeriments dels usuaris aliniats amb la frase original i la frase traduïda automàticament, per facilitar la tasca de millora als desenvolupadors del traductor.

Amb tot açò, vam decidir escriure un article, ja que un dels temes del congrés era el de Descripció pràctica d’integració i ús de RBTM, i el cas del traductor de Softcatalà és un exemple paradigmàtic d’ús molt gran d’un traductor automàtic basat en regles. L’article es va titular “A Widely Used Machine Translation Service and its Migration to a Free/Open-Source Solution: the case of Softcatalà“, i es troba publicat sota llicència Creative Commons al repositori obert de la UOC. També el penjaré a la secció de recerca (encara per fer) d’aquesta web, on aniré posant tota la informació relativa a les meues publicacions.

La presentació de l’article va dur associat un torn de preguntes molt productiu, en què moltes millores es van proposar al sistema, tant de cara als usuaris finals, com de cara als mantenidors del traductor. Ara només falta que, poquet a poquet, anem implementant totes eixes millores al servei de Softcatalà. Va estar molt bé l’experiència. Ací podeu veure la presentació de l’article.

DEA superat!

// desembre 14th, 2009 // 6 comentaris » // Personal, Universitat

Prou de temps després d’haver intentat començar, molt més tard del que esperava, i quasi un any exacte des que vaig començar el meu contracte en el project Sistemes de Codi Obert per a Biblioteques Digitals: Eines Lingüístiques i Educatives, per fi he acabat (amb èxit) el DEA.

D’una cosa totalment diferent a la que pensava que anava a treballar quan vaig començar a estudiar el doctorat (no té res a veure amb la traducció automàtica), el passat dimecres 2 de desembre de 2009, vaig fer la presentació del meu treball de suficiència investigadora Models estadístics per a vocabularis.

En aquest treball he intentat, mitjançant noves propostes i variants a mètodes existents, aconseguir una manera de determinar, amb fiabilitat, la probabilitat de què una paraula siga d’una llengua determinada. Parlant d’una manera més senzilla, diem que una paraula “ens sona” a anglesa, francesa o valenciana per determinades característiques.  Un exemple clar és el de la marca de gelats Häagen Dazs, que es va fer per a que als clients americans els semblara escandinau/germànic, però que realment no significa absolutament res.

Aquesta associació entre un paraula i la llengua a la que pertany som capaços de fer-la de manera intuïtiva, analitzant característiques de les paraules sense adonar-nos-en. Algunes de les característiques poden ser

  • Les lletres que composen les paraules
    • Alfabets diferents: Si té caràcters àrabs/xinesos/hindús direm que la paraula és arab/xinesa/hindú
    • Caràcters “pròpis”: amb ‘ç‘, ‘ñ‘ o ‘õ‘ les paraules ens semblen més valencianes, castellanes o portugueses, respectivament, que angleses.
  • Seqüències de lletres característiques
    • Plurals: en llengües romàniques del bloc occidental (francés, portugués, castellà, català, occità) a més d’altres llengües com l’anglés, els plurals es fan afegint una ‘-s‘, mentre que en llengües romàniques del bloc oriental (italià, romanés o la llengua ja extinta dàlmata).
    • Dígrafs: parelles de caràcters que representen un únic so, una única “lletra” parlada (fonema). Exemples són “-ix-” català o “-sh-” anglés, o “-ch-” castellà i “-tx-” català, etc.
    • Terminacions verbals: les conjugacions dels verbs també indiquen, i molt, a quina llengua podria pertànyer una paraula; així, per exemple, “-ava” és típica del català, “-aba” del castellà, i “-ing” de l’anglés.
    • Altres seqüències frequents: sense necessitat de saber de què es tracta, a nosaltres la terminació “-ght” ens sembla molt anglesa, o la “-eau” molt francesa.
  • Llargària de les paraules:
    • Algunes llengües tenen, de manera habitual, paraules més llargues (com l’alemany o el basc) que el altres (com el català o l’anglés), sobre tot degut a que són llengües aglutinatives.

El que he intentat jo és trobar una bona manera per detectar totes aquestes característiques de manera automàtica, de manera que el sistema siga capaç de decidir amb una certa fiabilitat si una paraula s’adequa a una determinada llengua o no. Existien ja diversos mètodes que feien això (basats en n-grames i en models de Markov d’ordre variable, la majoria), i el meu treball ha consistit en proposar dues noves formes de construir models i comparar-los amb els mètodes existents.

He aconseguit millores de predicció amb els models de Markov dinàmics i amb els models ocults de Markov dinàmics (una nova forma d’inicialitzar els clàssics models de Markov) respecte als models de n-grames i a arbres probabilístics de sufixos, encara que a un cost espacial prou gran (els meus models gasten molta més memòria).

I he aprovat el treball 😀

He de donar les gràcies a molta gent, ja que sense la seva ajuda directa no haguera pogut fer el treball. En primer lloc a Rafa Carrasco, el meu director, ja que les seves idees i propostes són part fonamental del treball. També a Juan Antonio, jefe del grup d’investigació (i membre del tribunal) pels ànims que em va donar des de primera hora per a fer el treball. I també a Felipe, que en les últimes setmanes em va ajudar moltíssim, sobre tot a l’hora de preparar la meva presentació: és gràcies a ell que vaig fer una presentació de la qual vaig eixir molt content. A Miquel, Víctor i Héctor, companys de curro i esmorzar, també els he d’agrair el suport, consells i l’ajuda oferida en tot moment.

19 de novembre: vaga informàtica…

// novembre 17th, 2008 // 1 comentari // Informàtica, Miniposts, Universitat

Volia escriure alguna coseta al respecte d’aquesta vaga/manifestació, però la veritat és que hi ha moltes coses per explicar, i poc de temps.

Però lo bo de la blogosfera és que sempre trobes algú que ha fet la feina per tú 😛

La manifestació del 19N, dilemes ètics

Gràcies, Joan!

Estiu 2.0 (dimecres)

// agost 2nd, 2008 // No hi ha comentaris » // Internet, Universitat

Continuant amb la sèrie d’entrades al voltant del curset que vaig fer la setmana passada, ara és el moment de parlar de l’equador del curset: dimecres.

El dia començava amb una xarrada de Faraón Llorens, qui fins ara era Vicerrector d’Innovació (crec, després de les eleccions no sé quin és el seu càrrec). He de dir la veritat: no vaig anar. Era matí (:P) i no sé perquè em pensava que no parlaria massa de web2.0, sinó de “nadius digitals” i tot això. Per cert, després m’ho van confirmar 😀

Després, quan Faraón va acabar, era el torn d’Héctor Garcia, Kirai per als internautes. Va parlar d’Internet a Japó i Àsia, en una conferència realment apassionant, d’on tots vam eixir sabent perquè el seu mobil no tenia bluetooth, ni melodies xules, i no pot enviar SMS. En canvi, pot veure la TDT, està connectat a Internet a 7.2 Mbps des del seu keitai.

Més tard, Pedro Pernías va parlar un poc, ja a l’aula del curs, de les Biblioteques digitals, i seu paper en l’adaptació de l’educació a un nou paradigma educatiu: l’educació 2.0. Sincerament, em va agradar més del que m’esperava.

I per acabar el dia, Kirai ens va tornar a obsequiar amb una xarrada, ara sobre el funcionament dels cercadors de blogs en internet. Gràcies a la seva experiència a Technorati durant més de dos anys, vam aprendre com feien aquestos cercadors per indexar tota l’activitat de la blogosfera mundial. Curta, però molt bona. Gràcies, Héctor.

Vaig fer un 3/4 del dia, però sense cap dubte, un dia 100% productiu 😉

Estiu 2.0 (dimarts)

// juliol 30th, 2008 // 1 comentari // Internet, Universitat

Continuant amb la sèrie d’entrades al voltant del curset que vaig fer la setmana passada, toca parlar del que es va fer dimarts.

  1. Dimarts 22 de juliol.

Dimarts era el dia de les xarxes socials.

Va començar amb una conferència de Carlos Sánchez, creador del mashup nvivo.es. Per al que no ho sàpiga, amb paraules de Carlos:

Tècnicament, es una xarxa social vertical orientada al sector de la música en directe. Funcionalment, té com a doble objectiu que els fans no es perden ni un concert, i ajudar a la promoció dels artistes, les sales i les promotores dels concerts.

Està feta tot utilitzant APIs de Flickr, de Youtube, de 11870.com, last.fm, MusicBrainz, … una bona mostra de que mesclant coses bones en pot ixir una altra de molt bona 😉 Ens va donar un consell, molt bo al meu parer, per a aprofitar dades d’altres: CACHÉ, CACHÉ i CACHÉ.

Si algú vol llegir alguna cosa més de Carlos, hi ha una bona entrevista feta per Consumer.

Després va vindre Felix Ruiz (que va anar de boda diumenge :P), de tuenti. Ens va fer un tostó de xarrada, amb algunes xifres que no sé si són certes, però el que si que sé es que eren enormes: més de 30.000 usuaris a la Universitat de Sevilla, que estaven comprant més de 30 servidors a la setmana, que tenien 3.000 milions de pàgines vistes al mes, pensaven multiplicar per 5 la plantilla abans d’acabar l’any (ara n’eren 28, i pensaven arribar als 100)… Sincerament, no em va donar cap bona impressió. A més, no va fer el que se suposava que havia de fer, segons el títol de la xarrada: “Xarxes socials universitaries”. Pareixia més un anunci de tuenti. :S

Finalment, per acabar el dia, vam fer la segona part del taller de Ruby on Rails. En la segona sessió tocava AJAX, i altres efectes de llibreries javascript (encara que ho van vendre tot com a AJAX :S). Com que prototype està totalment integrat en Rails, no cal calfar-se molt el cap per fer les coses. Igual que en la sessió prèvia, massa informació i massa copy&paste per a massa poc temps.

Dia completet, no?

Estiu 2.0 (dilluns)

// juliol 28th, 2008 // 2 comentaris » // Internet, Universitat

La setmana passada vaig assistir al curs La web 2.0: Retos y tecnologías para la Internet de nueva generación” que se celebrava a la Universitat d’Alacant, dins del programa de cursos de la Universitat d’Estiu Rafael Altamira. Com a bon curs 2.0, disposavem d’una xarxa social pròpia i tot: Estiu2.0!

Volia escriure coses durant la setmana passada, però per a variar vaig anar un poc de cul 😀

El curset va estar prou interessant en termes generals: bons conferenciants, una taula redona interessant i sobre tot moltes idees per al futur professional més immediat.

Anirem per parts, i cada dia en publicaré una (així, de passada, hi ha actualitzacions més constants del bloc, sense fer lo que faig habitualment: dos setmanes sense posar res, i 4 o 5 entrades en un dia :D)

  1. Dilluns 21 de juliol.

Després d’una xarrada inicial de Juan Antonio Pérez i Domingo Gallardo, presentant breument el curs, Antonio Ortiz (Error500, co-fundador de WeblogsSL) ens va parlar sobre l’evolució dels blogs dins d’internet, de com han passat de ser una eina principalment personal a com s’han convertit en vertaders nano-mitjans de comunicació. Va estar francament interessant.

Després, Juan Antonio i Domingo van fer una introducció a la Web 2.0 en general: serveis, principis, definicions, etc. Per a algú que ja sap de que va tot això de la web 2.0 podia resultar un poc avorrit, però és necessari en un curs d’aquest estil.

Per la vesprada, vam fer la primera part del taller de Ruby on Rails. Des del meu punt de vista, una de les parts més prescindibles del curset: en unes poques hores no es pot aprendre gens d’una plataforma (Rails) i un llenguatge (Ruby) desconegut per a pràcticament tothom, i el taller es va convertir en una activitat de principalment copy&paste. Tot i això, si que va servir per a veure que, per a alguns projectes, utilitzar frameworks del tipus de Rails agilitza moltíssim les coses. Tant que fins i tot vam plantejar-nos utilitzar-lo per a certes coses, Héctor i jo. Però això serà un altre post 😀

A més, teníem que fer grups per a presentar idees per al concurs de projectes innovadors. Jo vaig fer grup amb Óscar J. Baeza, de SferaZero i Kafelog. Un tio de categoria 😉

Si pugueres tornar enrere, quina carrera estudiaries ara?

// juny 22nd, 2008 // 4 comentaris » // Personal, Universitat

Últimament sembla comú entre tots els companys de carrera comentar que, si fora ara, no estudiarien la mateixa carrera.

Jo moltes vegades he dit que si fora ara, començaria per estudiar l’Enginyeria Tècnica, i després ja faria el 2n cicle de la superior: pel mateix preu, tens dues carreres (i et conta com a tal a l’hora de presentar-te a algunes places, i fins i tot hi ha places només per a enginyers tècnics).

Quan estudiava el Batxillerat, no sabia quina carrera triaria; només sabia una cosa: m’agradaven les matemàtiques. Per contra, també sabia que no faria la Llicenciatura en Matemàtiques, ja que no volia ser professor. Això em desviava cap a les Enginyeries, i ja que “la informàtica és el futur“, aquesta va ser la carrera que vaig triar. Però igual haguera pogut triar Telecomunicacions, per exemple.

Ara, passats ja uns anys, i després d’haver treballat com a informàtic en diferents aspectes (servei tècnic a Connecta, programador al Taller Digital de la UA i profe de pràctiques a l’IES Josep Iborra mentre em treia el CAP), la docència no m’ha desagradat, i crec que podria ser una bona eixida laboral (si no ix bé la carrera investigadora).

Però després de llegir l’entrada d’Enrique, m’he decidit a ser el primer en continuar el meme que proposa.

El fet es que realment no crec que si enguany haguera fet la selectivitat i haguera de fer la preinscripció universitària tornara a triar Eng. en Informàtica com a primera (i única) opció. Quan ho vaig fer, vaig triar informàtica a les 5 universitats del país que la oferien (UA, UPV, UJI, UV, UMH), en les distintes poblacions on ho oferien (Sant Vicent del Raspeig, València, Castelló, Alcoi, Elx).

Docència, si, però d’Informàtica? I per què no de Matemàtiques? O d’una altra cosa?

I si no docència, què?

Segurament, si ara tornara als 18 anys (sabent el que sé ara, cosa impossible), no faria cap Enginyeria. Ni possiblement tampoc cap carrera de Ciències. Estudiaria, molt probablement, música.

Coses que passen…
... i més que en passaran.

// maig 21st, 2008 // No hi ha comentaris » // Personal, Universitat

A mesura que passen els dies, setmanes, mesos i anys, les coses canvien.

Això, en principi, ha de ser bo, ja que cada instant que passa ens aporta noves experiències que ajudaran, una vegada assumides, a millorar la nostra personalitat.

Tot el que passa afecta la nostra manera de ser i de comportar-nos davant la resta, i és per això que hem d’intentar traure profit de tot el que puguem.

Ahir va començar la tercera setmana des de que estic ací al DLSI com a pseudo-becari (sense cap beca encara), a l’espera de què es resolguen d’una vegada les FPU del nou i flamant Ministeri de Ciència i Innovació, i la veritat és que fins el moment no han sigut tan productives com haurien d’haver-ho sigut. No vull dir que no haja avançat, que si que ho he fet, però no a la velocitat i el ritme que tocaria.

D’altra banda, la banda. Aquest ha sigut (i serà) un mes intens en actuacions: comunions, corpus, dos concerts… Quién da más?

També hi ha altres coses que no van tan bé, per dir-ho d’alguna manera, i m’agradaria que si que ho feren. Però tot i que no es pot tindre tot, sempre s’ha d’intentar.

L’autèntic perdedor no és aquell que no guanya. L’autèntic perdedor és aquell que té tanta por a no guanyar que ni tan sols ho intenta.

Alan Arquin

Editat 22/05/2008: Per cert, lo que tinc estudiant per BCN, perfecte 😉