Vairavimo maršruto skaičiavimo, grindžiamo skatinamuoju mokymusi, vizualios aplinkos kūrimas
Articles
Oskaras Klimašauskas
Vilnius University, Lithuania
Gintautas Dzemyda
Vilnius University, Lithuania
Published 2024-05-13
https://doi.org/10.15388/LMITT.2024.7
PDF

How to Cite

Klimašauskas, O. and Dzemyda, G. (2024) “Vairavimo maršruto skaičiavimo, grindžiamo skatinamuoju mokymusi, vizualios aplinkos kūrimas”, Vilnius University Open Series, pp. 48–56. doi:10.15388/LMITT.2024.7.

Abstract

Straipsnyje yra sprendžiamas optimalaus maršruto kelių tinkle paieškos uždavinys. Uždavinys yra modelinis, nes kelių tinklas pasirinktas stačiakampis su vienodomis tiesiomis atkarpomis, o kai kuriose sankryžose yra veikiantis šviesoforas. Uždavinys sprendžiamas naudojantis skatinamojo mokymosi algoritmais. Straipsnyje siekiama palyginti skirtingus skatinamojo mokymosi algoritmus, o taip pat sukurti vizualią aplinką, leidžiančią stebėti skatinamojo mokymosi procesą. Vizuali aplinka yra sudaryta iš automobilio, kelių ir šviesoforų tinklo, bei galutinio finišo. Mokymasis vyksta siekiant minimizuoti pravažiuotų atkarpų skaičių. Algoritmai, sunaudojantys mažiausią tokių atliktų žingsnių skaičių ir tuo būdu randantys sprendimą greičiausiai, yra geriausi. Tyrime buvo naudojami keturi skatinamojo mokymosi algoritmai: Q-learning, Sarsa, Sarsa(λ), Actor-critic. Pasiūlytos realizacijos, labiausiai tinkančios sprendžiamam uždaviniui. Aplinka naudinga susipažįstantiems su skatinamuoju mokymusi ir jo principais. Straipsnyje pateikiama nuoroda į aplinkos programos kodą ir instrukcijos, kaip ja pasinaudoti. Tai turėtų išplėsti skatinamojo mokymosi taikymus.

PDF
Creative Commons License

This work is licensed under a Creative Commons Attribution 4.0 International License.

Downloads

Download data is not yet available.