Vaizdų aprašų generavimo modeliai
Articles
Artūr Radzivilov
Vilniaus Gedimino technikos universitetas
Published 2024-05-14
https://doi.org/10.15388/LMITT.2024.16
PDF

How to Cite

Radzivilov, A. (2024) “Vaizdų aprašų generavimo modeliai”, Vilnius University Open Series, pp. 115–122. doi:10.15388/LMITT.2024.16.

Abstract

Šiame straipsnyje yra nagrinėjami vaizdų aprašų generavimo modeliai, kurių pagalba galima automatizuoti teksto aprašymų kūrimą iš vaizdinės informacijos. Pateikiamos įvairios neuroninių tinklų struktūros, tokios kaip CNN ir RNN, kurios naudojamos vaizdų savybių išgavimui ir teksto generavimui, bei dėmesio mechanizmai ir „transformer“ tipo tinklai, leidžiantys geriau integruoti vaizdo ir tekstinę informaciją. Analizuojami pagrindiniai duomenų rinkiniai, naudojami modelių mokymui, ir aprašymų vertinimo metodai, skirti įvertinti generuotų teksto aprašymų kokybę. Taip pat aptariamos naujausios tendencijos ir iššūkiai šioje srityje, pabrėžiant būsimų tyrimų kryptis.

PDF
Creative Commons License

This work is licensed under a Creative Commons Attribution 4.0 International License.

Downloads

Download data is not yet available.

Most read articles by the same author(s)

<< < 5 6 7 8 9 > >>