Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius

Paulius Zaranka; Gražina Korvel

doi:10.15388/LMITT.2024.22

Articles

Paulius Zaranka

Vilnius University, Lithuania

Gražina Korvel

Vilnius University, Lithuania

Published 2024-05-13

https://doi.org/10.15388/LMITT.2024.22

PDF

How to Cite

Zaranka, P. and Korvel, G. (2024) “Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius”, Vilnius University Open Series, pp. 154–159. doi:10.15388/LMITT.2024.22.

Download Citation

Abstract

Didėjant informacijos kiekiui ir jos svarbai visuomenėje atsiranda vis didesnis poreikis automatinių įrankių, gebančių atpažinti propagandą. Dėl geopolitinės situacijos Lietuvos valstybė gali būti ypatingai pažeidžiama propagandinių mechanizmų, o automatinis jos atpažinimas lietuviškuose tekstuose yra nepakankamai ištyrinėta sritis. Šio darbo tikslas – išbandyti 3 pagrindinius transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius propagandos atpažinimui. Sprendžiamas binarinis klasifikavimo uždavinys, priskiriant tekstui propagandinio arba nepropagandinio teksto klasę. LitLat, XLM-R ir mBERT modeliai adaptuoti apmokant ekspertų suanotuotu duomenų rinkiniu. Nors geriausią, 88,5 % F1 statistikos įvertį pavyko pasiekti adaptavus LitLat iš anksto apmokytą modelį, kiti šiame darbe adaptuoti modeliai pasiekia panašius rezultatus.

PDF

This work is licensed under a Creative Commons Attribution 4.0 International License.

Downloads

Download data is not yet available.

Most read articles by the same author(s)

Donata Petkutė, Gražina Korvel, Draudimo sektoriaus klientų atsiliepimų ir vertinimų nuotaikų kaitos analizė laike , Vilnius University Open Series: 2024: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"
Eglė Kondrataitė, Gražina Korvel, Early Detection of Rare Diseases using Natural Language Processing , Vilnius University Open Series: 2024: Proceedings of the Conference "Lithuanian MSc Research in Informatics and ICT"