<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="21537" NadgradivoID="407" NRID="27012739" OceID="0" DomainUrl="https://repozitorij.upr.si/" IzpisPolniUrl="https://repozitorij.upr.si/IzpisGradiva.php?lang=slv&amp;id=21537" StOgledov="751" StPrenosov="7" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-04-10 17:58:11" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUP-21537">20.500.12556/RUP-21537</PID>
  <Naslov>Dataset of vocabulary in Uzbek primary education</Naslov>
  <Podnaslov>extraction and analysis in case of the school corpus</Podnaslov>
  <TujJezik_Naslov></TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>The main goal of this research work is to determine the number of new words that a primary school pupil should know/acquire during each academic year. To accomplish this, we have created two datasets. The first dataset was compiled based on the &quot;Explanatory Vocabulary of the Uzbek Language&quot; (EDUL). The second dataset was created from 35 primary school textbooks for grades 1-4 approved by the Ministry of Preschool and School Education of the Republic of Uzbekistan, and it was named the &quot;Uzbek Primary School Corpus&quot; (UPSC) by authors. Using the &quot;Comparative Lemma Extraction Method&quot; (CLEM) proposed by the authors of the article, a vocabulary for grades 1-4 was created, and the problem of determining the number of new words (disregarding word forms as Uzbek is a morphologically rich language) that primary school pupils should learn each academic year was solved.</Opis>
  <TujJezik_Opis></TujJezik_Opis>
  <KljucneBesede>
    <Beseda>Uzbek language</Beseda>
    <Beseda>primary school</Beseda>
    <Beseda>corpus construction</Beseda>
    <Beseda>natural language processing (NLP)</Beseda>
    <Beseda>comparative Lemma extraction method</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>uzbeški jezik</Beseda>
    <Beseda>osnovna šola</Beseda>
    <Beseda>konstrukcija korpusa</Beseda>
    <Beseda>obdelava naravnega jezika (NLP)</Beseda>
    <Beseda>metoda primerjalne ekstrakcije lem</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1033" ISO639-3="eng">Angleški jezik</Jezik>
  <TujJezik ID="1060" ISO639-3="slv">Slovenski jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="dk_c" DRIVER="info:eu-repo/semantics/article">Članek v reviji</VrstaGradiva>
  <DatumVstavljanja>2025-08-08 09:55:04</DatumVstavljanja>
  <DatumObjave>2025-08-08 09:55:11</DatumObjave>
  <DatumSpremembe>2025-08-09 03:05:29</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2025</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani>str. 1-12</StStrani>
  <StevilcenjeNivo1>article 111349</StevilcenjeNivo1>
  <StevilcenjeNivo2>Vol. 59</StevilcenjeNivo2>
  <Kronologija>Apr. 2025</Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>NiDoloceno</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>2025-02-03</DatumObjaveClanka>
  <Licence>
    <Licenca ID="6" Kratica="CC BY 4.0" Naziv="Creative Commons Priznanje avtorstva 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by/4.0/deed.sl" Logo="by.png" LogoPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/licence/by.png" DatumZacetkaLicenciranja="" VezanoNa="" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="15752" Ime="Khabibulla" Priimek="Madatov" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="408318467" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="19448" Ime="Sapura" Priimek="Sattarova" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="446586883" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="60" Ime="Jernej" Priimek="Vičič" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="13866851" Afiliacija="" ArrsID="23555" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">004.65:811.5</Identifikator>
    <Identifikator ID="9" Sifra="ISSN-clanka" Naziv="ISSN pri članku" URL="">2352-3409</Identifikator>
    <Identifikator ID="15" Sifra="DOI" Naziv="DOI" URL="http://dx.doi.org/10.1016/j.dib.2025.111349">10.1016/j.dib.2025.111349</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS.SI-ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/225129475">225129475</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="31324" DatotekaNRID="14393482" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/fileTypes/pdf.gif" VelikostDatoteke="351096" VelikostDatotekeKratko="342,87 KB" DatumVstavljanja="2025-08-08 09:56:54" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>RAZ_Madatov_Khabibulla_2025.pdf</Naziv>
      <OrgNaziv>RAZ_Madatov_Khabibulla_2025.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>B099D0590099A4FB7D1438D190B9CE01</MD5>
      <SHA256>3a045496cbd1bba4bc080829400908b0b71ea596c3b91df2a13ead4e4524cb43</SHA256>
      <UUID>44376bd7-742d-11f0-8f0b-005056ac49c0</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.upr.si/Dokument.php?lang=slv&amp;id=31324</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1033" Oznaka="" Dolzina="34608"></Vsebina>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="31323" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="html.gif" IkonaFormataPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/fileTypes/html.gif" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2025-08-08 09:55:18" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://www.sciencedirect.com/science/article/pii/S2352340925000812</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>0afb8e39-742d-11f0-8f0b-005056ac49c0</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.upr.si/Dokument.php?lang=slv&amp;id=31323</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="3" Kratica="FAMNIT" ZavodEvsID="0000093" Logo="" LogoPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/logo/">Fakulteta za matematiko, naravoslovje in informacijske tehnologije</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.01" Koda="1.01" Naziv="Izvirni znanstveni članek" SchemaOrg="Article"></TipologijaDela>
  <OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/EC//739574" Stevilka="739574" Naslov="Renewable materials and healthy environments research and innovation centre of excellence" Akronim="InnoRenew CoE" Delez="50"></OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/EC//610170-EPP-1-2019-1-ES-EPPKA2-CBHE-JP" Stevilka="610170-EPP-1-2019-1-ES-EPPKA2-CBHE-JP" Naslov="Establishment of training and research centers and Courses development on Intelligent BigData Analysis in CA" Akronim="" Delez="50"></OpenAIRE>
  </OpenAIRE>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
