<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="23061" NadgradivoID="1262" NRID="0" OceID="0" DomainUrl="https://repozitorij.upr.si/" IzpisPolniUrl="https://repozitorij.upr.si/IzpisGradiva.php?lang=slv&amp;id=23061" StOgledov="37" StPrenosov="4" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-21 04:51:38" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUP-23061">20.500.12556/RUP-23061</PID>
  <Naslov>Dataset of Uzbek base words</Naslov>
  <Podnaslov>extraction and data analysis based on the school corpus</Podnaslov>
  <TujJezik_Naslov></TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>The article presents a dataset of Uzbek base words extracted from a purposefully prepared corpus using the Synonym Thesaurus Support method. This method identifies base words for each school-grade by analysing a large text corpus comprising 142 textbooks intended for school education in Uzbekistan. The definition of the base word used in this article and in the proposed dataset is a word within a synonymic series that: - is the most widely used. - is distinguished by semantic clarity and stability. - has stylistic neutrality. Based on the proposed approach, school textbooks were analysed by dividing them into Primary (school grades 1 - 4), Basic Secondary (school grades 5 - 9), and Secondary (school grades 10 - 11) blocks. Base words that stand out from the general corpus were identified for each school-grade. This method extracted new base words not found in previous school grades and specific to the observed grade. The main idea of the method is to extract base words from the lemma sset of each school-grade using a corpus of synonyms. This allows analysing the level of lexical complexity and class-specific vocabulary richness of texts intended for schoolchildren. The final results are lists of base words specifically extracted from primary (school-grades 1 - 4), basic secondary (school-grades 5 - 9), and secondary (school-grades 10 - 11) school texts; 17,599,48,203, and 20,491 base words, respectively.</Opis>
  <TujJezik_Opis>Članek predstavlja nabor podatkov o osnovnih besedah ​​v uzbekistanščini, pridobljenih iz namensko pripravljenega korpusa z uporabo metode podpore sinonimnega tezavra. Ta metoda identificira osnovne besede za vsako šolsko stopnjo z analizo velikega besedilnega korpusa, ki obsega 142 učbenikov, namenjenih šolskemu izobraževanju v Uzbekistanu. Opredelitev osnovne besede, uporabljene v tem članku in v predlaganem naboru podatkov, je beseda v sinonimnem nizu, ki: - je najbolj razširjena. - se odlikuje po pomenski jasnosti in stabilnosti. - ima stilsko nevtralnost. Na podlagi predlaganega pristopa so bili šolski učbeniki analizirani tako, da so bili razdeljeni na osnovne (1.–4. razredi šole), srednješolske (5.–9. razredi šole) in srednje (10.–11. razredi šole) bloke. Za vsak razred šole smo identificirali osnovne besede, ki izstopajo iz splošnega korpusa. Ta metoda je izluščila nove osnovne besede, ki jih ni bilo v prejšnjih šolskih razredih in so specifične za opazovani razred. Glavna ideja metode je izluščiti osnovne besede iz niza lem vsakega šolskega razreda z uporabo korpusa sinonimov. To omogoča analizo stopnje leksikalne kompleksnosti in razredno specifičnega besednega zaklada besedil, namenjenih šolarjem. Končni rezultati so seznami osnovnih besed, posebej izvlečenih iz osnovnošolskih (šolski razredi 1–4), osnovnošolskih (šolski razredi 5–9) in srednješolskih (šolski razredi 10–11) šolskih besedil; 17.599, 48.203 in 20.491 osnovnih besed.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>school corpus</Beseda>
    <Beseda>base word</Beseda>
    <Beseda>basic vocabulary</Beseda>
    <Beseda>Uzbek language</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>šolski korpus</Beseda>
    <Beseda>osnovna beseda</Beseda>
    <Beseda>osnovno besedišče</Beseda>
    <Beseda>uzbeški jezik</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>true</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1033" ISO639-3="eng">Angleški jezik</Jezik>
  <TujJezik ID="1060" ISO639-3="slv">Slovenski jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="dk_c" DRIVER="info:eu-repo/semantics/article">Članek v reviji</VrstaGradiva>
  <DatumVstavljanja>2026-05-20 09:08:03</DatumVstavljanja>
  <DatumObjave>2026-05-20 09:08:08</DatumObjave>
  <DatumSpremembe>2026-05-21 03:10:11</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2026</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani>str. 1-9</StStrani>
  <StevilcenjeNivo1>article 102749</StevilcenjeNivo1>
  <StevilcenjeNivo2>Vol. 13</StevilcenjeNivo2>
  <Kronologija>Jun. 2026</Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>Zaloznikova</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>2026-04-18</DatumObjaveClanka>
  <Licence>
    <Licenca ID="6" Kratica="CC BY 4.0" Naziv="Creative Commons Priznanje avtorstva 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by/4.0/deed.sl" Logo="by.png" LogoPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/licence/by.png" DatumZacetkaLicenciranja="" VezanoNa="" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="15752" Ime="Khabibulla" Priimek="Madatov" AltIme="Khabibula Madatov" VlogaID="70" VlogaNaziv="Avtor" ConorID="408318467" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="21245" Ime="Surayyo" Priimek="Khajibaeva" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="471302403" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="60" Ime="Jernej" Priimek="Vičič" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="13866851" Afiliacija="" ArrsID="23555" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">81&#039;322.4:811.5</Identifikator>
    <Identifikator ID="9" Sifra="ISSN-clanka" Naziv="ISSN pri članku" URL="">2590-2911</Identifikator>
    <Identifikator ID="15" Sifra="DOI" Naziv="DOI" URL="http://dx.doi.org/10.1016/j.ssaho.2026.102749">10.1016/j.ssaho.2026.102749</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS.SI-ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/278726403">278726403</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="33699" DatotekaNRID="0" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/fileTypes/pdf.gif" VelikostDatoteke="2540733" VelikostDatotekeKratko="2,42 MB" DatumVstavljanja="2026-05-20 09:13:27" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv>RAZ_Madatov_Khabibulla_2026.pdf</Naziv>
      <OrgNaziv>RAZ_Madatov_Khabibulla_2026.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>E8695F5F3B4D7C0E7DBD187A6B04293A</MD5>
      <SHA256>d2f3627b2c55a22fcc1d3e0485973fd8aff925a1de0b7c6f25de044f6783c676</SHA256>
      <UUID>4b345877-541b-11f1-9e8d-005056ac49c0</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.upr.si/Dokument.php?lang=slv&amp;id=33699</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1033" Oznaka="" Dolzina="45116"></Vsebina>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="33697" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="html.gif" IkonaFormataPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/fileTypes/html.gif" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2026-05-20 09:08:09" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://www.sciencedirect.com/science/article/pii/S2590291126003141?via%3Dihub</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>8d982c58-541a-11f1-9e8d-005056ac49c0</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.upr.si/Dokument.php?lang=slv&amp;id=33697</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="3" Kratica="FAMNIT" ZavodEvsID="0000093" Logo="" LogoPolniUrl="https://repozitorij.upr.si/teme/rupDev/img/logo/">Fakulteta za matematiko, naravoslovje in informacijske tehnologije</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.01" Koda="1.01" Naziv="Izvirni znanstveni članek" SchemaOrg="Article"></TipologijaDela>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
