Laboratorij za analizu teksta i inženjerstvo znanja (TakeLab) bavi se semantičkom analizom teksta, analizom medija i poslovnom inteligencijom. Istraživanje je usredotočeno na primjenu postupaka strojnog učenja, odnosno obrade prirodnog jezika, u sustavima za ekstrakciju i obradu informacija iz tekstnih izvora.
U okviru projekta TermEx, razvijamo web-platformu za automatsku ekstrakciju stručne terminologije iz teksta i tražimo jednog studenta da nam se pridruži. Alat ovakvog tipa neophodan je za brz, točan i dosljedan prijevod teksta, što postaje sve teže s većim brojem dokumenata. Nažalost, postojeći alati ne zadovoljavaju sve potrebe prevoditeljske zajednice tako da smo, u suradnji s profesionalnim prevoditeljima iz Hrvatske i inozemstva, odlučili izgraditi efikasno i prilagodljivo rješenje zasnovano na strojnom učenju – TermEx.
Posao uključuje razvoj moderne web-platforme koja bi prevoditeljima omogućila laku (i prilagodljivu) ekstrakciju i doradu stručne terminologije iz učitanih tekstova, ali i pregled već postojećih prijevoda drugih prevoditelja. Također, razvijamo i probnu inačicu alata za sakupljanje povratnih informacija od naših beta-korisnika.
Ako te zanima razvoj praktičnog alata do produkcijske razine, koji će se koristiti diljem prevoditeljske zajednice u Hrvatskoj, a i šire, javi se! Tražimo osobu koja se dobro snalazi u timu, ali je i vrlo samostalna te posjeduje sljedeća znanja i vještine:
- Dobro poznavanje JavaScripta (ES6),
- Iskustvo u radu s ReactJS-om ili drugim modernim frameworkom,
- Iskustvo u radu s Djangom, Flaskom ili sličnim frameworkom,
- Iskustvo u radu s HTML5 i CSS3,
- Iskustvo s korištenjem REST-servisa i API-ja,
- Iskustvo sa sustavom za verzioniranje kôda Git,
- Iskustvo u radu s relacijskim bazama,
- Poznavanje Pythona.
Tko smo mi?
Laboratorij za analizu teksta i inženjerstvo znanja (TakeLab) bavi se ekstrakcijom i obradom informacija iz tekstnih izvora. Istraživanja su usredotočena na postupke umjetne inteligencije, odnosno postupke obrade prirodnog jezika, dubinske analize teksta i strojnog učenja, s ciljem razvoja naprednih tehnologija za semantičku analizu teksta (za hrvatski i engleski jezik). Primjena obuhvaća sustave za pretraživanje i ekstrakciju informacija, sustave za upravljanje znanjem i dokumentima, sustave za analizu medija, političkih i marketinških trendova te sustave poslovne inteligencije, sigurnosno-obavještajne sustave i sl.
Kako se prijaviti?
Ako želiš biti dio ovoga projekta, javi se na maja.buljan@fer.hr do petka, 31. svibnja 2019. godine, u 23:59h. Poželjno je (ali ne i nužno) da uz prijavu pošalješ i poveznice na svoje prijašnje radove.