2026 m. gegužės 20 d. (trečiadienį), 15 val., VU Filologijos fakulteto J. Balkevičiaus auditorijoje vyks Virginijaus Dadurkevičiaus (Vytauto Didžiojo universitetas) ir Jurgio Pakerio (Vilniaus universitetas) paskaita „Tekstynas NoSketch Engine platformoje: sėkmės ir nesėkmės“.
Pranešime aptariama, kaip sekėsi VU mašininio vertimo tekstyną, surinktą 2014 m. iš atvirų internetinių šaltinių (apie 600 mln. žodžių), perkelti į atvirojo kodo „NoSketch Engine“ platformą. Nagrinėjamos tekstyno deduplikavimo, tokenizavimo ir lemavimo problemos, pristatomi planai atskirai skelbti lemų ir žodžių formų sąrašus. Bandomąją tekstyno versiją galima išbandyti šiuo adresu http://31.97.73.131:10070/ (žr. VU mašininio vertimo tekstynas).

Darbai atliekami vykdant projektą „Lietuvių kalbos priesaginių būdvardžių darybos produktyvumas tekstyno duomenimis“, kuriam finansavimą skyrė Lietuvos mokslo taryba (LMTLT), sutarties Nr. S-LISm-25-15.
Galimybė jungtis nuotoliu: https://teams.microsoft.com/meet/385224808217407?p=7M3rJxlZKh5W7P5uRM
