<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="21533" NadgradivoID="543" NRID="27001054" OceID="0" DomainUrl="https://repozitorij.upr.si/" IzpisPolniUrl="https://repozitorij.upr.si/IzpisGradiva.php?lang=slv&amp;id=21533" StOgledov="741" StPrenosov="17" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-04-11 07:32:02" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUP-21533">20.500.12556/RUP-21533</PID>
  <Naslov>Qualitative control learning can be much faster than reinforcement learning</Naslov>
  <Podnaslov></Podnaslov>
  <TujJezik_Naslov></TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>Reinforcement learning has emerged as a prominent method for controlling dynamic systems in the absence of a precise mathematical model. However, its reliance on extensive interactions with the environment often leads to prolonged training periods. In this paper, we propose an alternative approach to learning control policies that focuses on learning qualitative models and uses symbolic planning to derive a qualitative plan for the control task, which is executed by an adaptive reactive controller. We conduct experiments utilizing our approach on the cart-pole problem, a standard benchmark in dynamic system control. We additionally extend this problem domain to include uneven terrains, such as driving over craters or hills, to assess the robustness of learned controllers. Our results indicate that qualitative learning offers significant advantages over reinforcement learning in terms of sample efficiency, transferability, and interpretability. We demonstrate that our proposed approach is at least two orders of magnitude more sample efficient in the cart-pole domain than the usual variants of reinforcement learning.</Opis>
  <TujJezik_Opis></TujJezik_Opis>
  <KljucneBesede>
    <Beseda>qualitative modeling</Beseda>
    <Beseda>qualitative reasoning</Beseda>
    <Beseda>qualitative control</Beseda>
    <Beseda>transfer learning</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>kvalitativno modeliranje</Beseda>
    <Beseda>kvalitativno sklepanje</Beseda>
    <Beseda>kvalitativno vodenje</Beseda>
    <Beseda>prenosno učenje</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1033" ISO639-3="eng">Angleški jezik</Jezik>
  <TujJezik ID="1060" ISO639-3="slv">Slovenski jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="dk_c" DRIVER="info:eu-repo/semantics/article">Članek v reviji</VrstaGradiva>
  <DatumVstavljanja>2025-08-07 11:06:54</DatumVstavljanja>
  <DatumObjave>2025-08-07 11:06:55</DatumObjave>
  <DatumSpremembe>2025-08-08 03:03:36</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2025</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani>str. 1-21</StStrani>
  <StevilcenjeNivo1>article no. ǂ4</StevilcenjeNivo1>
  <StevilcenjeNivo2>Vol. 114</StevilcenjeNivo2>
  <Kronologija>2025</Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>NiDoloceno</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>2025-01-14</DatumObjaveClanka>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="15687" Ime="Domen" Priimek="Šoberl" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="50534243" Afiliacija="" ArrsID="31917" ORCID=""></Oseba>
    <Oseba ID="19436" Ime="Ivan" Priimek="Bratko" AltIme="I. Bratko; Ivan Bratko ml.;  Bratko" VlogaID="70" VlogaNaziv="Avtor" ConorID="1897059" Afiliacija="" ArrsID="02275" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">004.85</Identifikator>
    <Identifikator ID="9" Sifra="ISSN-clanka" Naziv="ISSN pri članku" URL="">0885-6125</Identifikator>
    <Identifikator ID="15" Sifra="DOI" Naziv="DOI" URL="http://dx.doi.org/10.1007/s10994-024-06724-7">10.1007/s10994-024-06724-7</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS.SI-ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/222246659">222246659</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="31316" DatotekaNRID="14392626" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/fileTypes/pdf.gif" VelikostDatoteke="1607474" VelikostDatotekeKratko="1,53 MB" DatumVstavljanja="2025-08-07 11:07:58" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>RAZ_Soberl_Domen_2025.pdf</Naziv>
      <OrgNaziv>RAZ_Soberl_Domen_2025.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>0481ED74AFC01EA22EAC32A81FB7E6DA</MD5>
      <SHA256>c0109317b6d662257b2caa2fd47d17fd0f8e6aaa7dbeda73e12f90d9f4084cdd</SHA256>
      <UUID>07095a9e-736e-11f0-8f0b-005056ac49c0</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.upr.si/Dokument.php?lang=slv&amp;id=31316</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1033" Oznaka="" Dolzina="60785"></Vsebina>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="31315" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="html.gif" IkonaFormataPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/fileTypes/html.gif" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2025-08-07 11:06:58" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://link.springer.com/article/10.1007/s10994-024-06724-7</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>e3300fca-736d-11f0-8f0b-005056ac49c0</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.upr.si/Dokument.php?lang=slv&amp;id=31315</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="3" Kratica="FAMNIT" ZavodEvsID="0000093" Logo="" LogoPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/logo/">Fakulteta za matematiko, naravoslovje in informacijske tehnologije</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.01" Koda="1.01" Naziv="Izvirni znanstveni članek" SchemaOrg="Article"></TipologijaDela>
  <OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//P2-0209-2022" Stevilka="P2-0209-2022" Naslov="Umetna inteligenca in inteligentni sistemi" Akronim="" Delez="100"></OpenAIRE>
  </OpenAIRE>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
