Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius
Articles
Paulius Zaranka
Vilnius University, Lithuania
Gražina Korvel
Vilnius University, Lithuania
Published 2024-05-13
https://doi.org/10.15388/LMITT.2024.22
PDF

How to Cite

Zaranka, P. and Korvel, G. (2024) “Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius”, Vilnius University Open Series, pp. 154–159. doi:10.15388/LMITT.2024.22.

Abstract

Didėjant informacijos kiekiui ir jos svarbai visuomenėje atsiranda vis didesnis poreikis automatinių įrankių, gebančių atpažinti propagandą. Dėl geopolitinės situacijos Lietuvos valstybė gali būti ypatingai pažeidžiama propagandinių mechanizmų, o automatinis jos atpažinimas lietuviškuose tekstuose yra nepakankamai ištyrinėta sritis. Šio darbo tikslas – išbandyti 3 pagrindinius transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius propagandos atpažinimui. Sprendžiamas binarinis klasifikavimo uždavinys, priskiriant tekstui propagandinio arba nepropagandinio teksto klasę. LitLat, XLM-R ir mBERT modeliai adaptuoti apmokant ekspertų suanotuotu duomenų rinkiniu. Nors geriausią, 88,5 % F1 statistikos įvertį pavyko pasiekti adaptavus LitLat iš anksto apmokytą modelį, kiti šiame darbe adaptuoti modeliai pasiekia panašius rezultatus.

PDF
Creative Commons License

This work is licensed under a Creative Commons Attribution 4.0 International License.

Downloads

Download data is not yet available.