Koncept "tezaurusa" sve se češće može pronaći u brojnim projektima, knjigama, brošurama i internetskim izvorima. Poput misteriozne pojave, plaši svojom nepoznatošću, jer puno je lakše reći "rječnik" nego upotrijebiti čudnu definiciju.
Tezaurus: što je to? Po čemu se razlikuje od običnog rječnika? Pokušajmo proučiti ova pitanja detaljnije i na pristupačan način.
Tumačenje pojma
U početku se koncept tezaurusa razmatrao sa stajališta rječnika, koji je predstavljao vokabular jezika s primjerima uporabe u tekstu.
Ozhegov tumači tezaurus kao rječnik određenog jezika, koji odražava vokabular u cijelosti, dok Efremova ovaj fenomen razmatra sa stajališta sistematiziranog skupa podataka u određenom području znanja.
Najkonkretnija definicija koristi se u filologiji, gdje se tezaurus shvaća kao sastavnica rječničke vrste, gdje su sva značenja riječi povezana semantičkim odnosima i odražavaju ključne odnose pojmova u određenom predmetnom području.
Kao što vidimo, prilično je teško odgovoriti na pitanje: "Tezaurus: što je to?" definitivno. Za uže proučavanje pojma, razmotrimo povijest njegova nastanka, vrste i odnose leksičkih jedinica u rječniku ove vrste.
Povijest nastanka
Engleski fizičar Roger smatra se utemeljiteljem tezaurusa; on ga je sistematizirao 1852. godine, podijelivši ga u skupine. Štoviše, svaka skupina bila je predstavljena nazivom pojma, a zatim su tu bili njegovi sinonimi za određene dijelove govora, popisi povezanih naziva, kao i reference na nazive drugih kategorija. Ideja o takvoj klasifikaciji bila je vrlo vrijedna, budući da se rječnik smatrao najprirodnijim i u najvećoj je mjeri opisivao vokabular jezika. U isto vrijeme, može se koristiti kao brza pretraga važnih pojmova. Od vremena prvog tezaurusa pa do danas redovito se transformira ovaj tip rječnika koji se koristi u mnogim područjima znanja i široko je popularan u cijelom svijetu. U isto vrijeme, proučavajući temu: "Tezaurus: što je to?" relevantan u mnogim obrazovnim institucijama.
Do danas su tezaurusi ostali najpopularniji način opisivanja znanja u bilo kojem području potrebnom za učinkovitu ljudsku percepciju.
Odnosi riječi u tezaurusu
Najčešći odnosi u klasičnom tezaurusu su:
- Sinonimija je pojava u kojoj se povezuju riječi istog dijela govora koje su slične u leksičkom značenju. Na primjer: sila-otadžbina, brigada-odred, grimizno - crveno itd.
- Antonimija je veza između riječi jednog dijela govora koje imaju suprotna leksička značenja. Na primjer: tišina - graja, nježan - nepristojan.
- Hiperonimija (hiponimija) je ključni odnos u svrhu opisivanja imenica. Hipernim ima široko leksičko značenje, izražava generički, opći naziv klase (skupa) objekata, predmeta, odnosno njegovih svojstava i karakteristika. Hiponim ima usko značenje; imenuje predmet (znak, svojstvo) kao element određenog skupa ili klase. Da bismo razjasnili ove odnose, predstavimo najjednostavniji primjer. riječi zvijer i tigar međusobno su povezani, a zajednički im je naziv zvijer- je hipernim u odnosu na hiponim tigar.
- Meronimija (partonimija) je odnos za imenice koji se tvori po principu “dio - cjelina”. Kao primjer, razmotrite riječi avion, stajni trap, porthole. U ovom slučaju, opći naziv transporta je holonim (cjelina, ime), a njegove komponente su meronimi.
- Posljedica (odnosi među glagolima). Na primjer, riječi idi i dođi povezani procesom i njegovom posljedicom (rezultatom).
- Razlog (također vrijedi samo za glagole). Razmotrimo primjer takvih odnosa, uzmimo riječi: biti bolestan – nedostajati. U ovom slučaju, razlog se može pronaći - propustiti jer je bilo zdravstvenih problema.
Što je tezaurus vidjet ćemo iz sljedećeg primjera.
Krevet je sprava za spavanje.
[hiperonim]: namještaj
[meronim]: kuća
[sinonim]: krevet, krevet.
Ovo je samo klasičan primjer tezaurusa ruskog jezika, ali svi rječnici ove vrste izgrađeni su upravo na ovom principu.
Funkcije tezaurusa
Rječnik tezaurus ima važne društvene, komunikacijske, znanstvene i druge funkcije.
On je:
- izvor stručnih znanja u širem ili užem predmetnom području, način sređivanja, opisivanja pojmova;
- alat za pretraživanje u protoku informacija;
- alat za ručnu analizu dokumentacije u tražilicama;
- alat za automatsko indeksiranje složenih tekstova.
Vrste tezaurusa
Raznolikost rječnika zahtijeva razmatranje ne samo pitanja: "Tezaurus: što je to?", Već i obraćanje pozornosti na vrste. To će nam pomoći da bolje razumijemo značajke ove vrste rječnika.
Zaključak
Nadamo se da smo na pristupačnom jeziku uspjeli objasniti što je tezaurus. Zahvaljujući primjerima, lako je razumjeti po čemu se razlikuje od drugih rječnika. Također smo obradili pitanje tezaurusa za pretraživanje informacija, koji se naširoko koriste u informacijskom sustavu za brzo pretraživanje i sistematizaciju milijuna jedinica.
Računalne tehnologije
Svezak 12, posebno izdanje 2, 2007
TEHNOLOGIJA ZA IZRADU TEZAURUSA PREDMETNOG PODRUČJA NA OSNOVU PREDMETNOG INDEKSA ENCIKLOPEDIJE
V. B. Barahnin
Institut za računalne tehnologije SB RAS, Novosibirsk, Rusija
e-mail: [e-mail zaštićen]
V. A. Nekhaeva Novosibirsk Državno sveučilište, Rusija e-mail: [e-mail zaštićen]
Ovaj rad opisuje tehnologiju za stvaranje tezaurusa objektne domene, koji se temelji na predmetnoj odrednici za specijaliziranu enciklopediju. Takva tehnologija nudi visokokvalitetni opis domene objekta korištenjem pouzdanih izraza, čime se omogućuje izgradnja prve faze tezaurusa uz minimalan angažman stručnjaka u ovom određenom području znanja. Predložena tehnologija također sadrži algoritam za izgradnju tezaurusa i web aplikaciju koja implementira ovaj algoritam.
Uvod
Jedan od najvažnijih čimbenika koji osigurava uspješnu provedbu integracijskih istraživačkih projekata je učinkovita znanstvena i informacijska podrška. Posebno, suradnja Istraživači više (i ne uvijek srodnih) specijalnosti zahtijevaju pažljivo usklađivanje terminologije jer se isti pojam može u različitim područjima znanosti označavati različitim pojmovima, a jedan pojam može označavati različite pojmove.
Još jedna zadaća informacijske potpore projektima je stvaranje integrirane kartoteke bibliografskih opisa dokumenata (tj. članaka, knjiga itd.) o temi projekta, sastavljene kombiniranjem resursa istraživača koji zajednički rade, od kojih svaki ima već sakupio kartoteku o jednoj ili drugoj temi (trenutačno se takve datoteke pohranjuju, u pravilu, na elektroničkim medijima). Kako bi se olakšalo pretraživanje u kartoteci, poželjno je da se ključne riječi koje karakteriziraju dokumente biraju, ako je moguće, iz jednog rječnika. Za automatsku klasifikaciju dokumenata uključenih u kartoteku ili potencijalno uključenih u nju iz elektroničkih baza podataka
© Institut za računalne tehnologije Sibirskog ogranka Ruske akademije znanosti, 2007.
znanstvenih publikacija kao što je baza sažetaka časopisa, "Current Contents" itd., čini se uputnim koristiti algoritam koordinatnog indeksiranja. Ovaj se algoritam temelji na uzimanju u obzir klasifikacijskih karakteristika pojmova (riječi i izraza) uključenih u tekst koji karakteriziraju određeno predmetno područje.
Rješavanje svih navedenih problema nemoguće je bez izrade rječnika stručnih pojmova, au tom rječniku potrebno je uspostaviti veze između pojmova i razvrstati pojmove. Takav se rječnik naziva tezaurusom (više detalja vidi u). Tezaurus (ili normativni tezaurus) je referentni rječnik koji sadrži sve leksičke jedinice jezika za pretraživanje informacija - deskriptore (zajedno s ključnim riječima koje se unutar određenog sustava za pretraživanje informacija smatraju sinonimima za te deskriptore), a deskriptori u rječniku moraju biti sistematizirani prema značenju, a semantičke veze među njima eksplicitno su izražene.
Međutim, sastavljanje tezaurusa "od nule" može zahtijevati vrlo velike troškove rada stručnjaka specijalista, koji moraju prikupiti sve pojmove koji dovoljno cjelovito pokrivaju predmetno područje, dogovoriti njihova značenja, uspostaviti veze i izvršiti klasifikaciju. Takve poteškoće koje se javljaju pri rješavanju, iako važnog, ali ipak pomoćnog problema, mogu negativno utjecati na izglede za njegovo rješenje.
Razvili smo i implementirali tehnologiju za izradu tezaurusa na temelju predmetnog indeksa specijaliziranih enciklopedija. Ova tehnologija pruža visoko kvalificirani opis predmetnog područja korištenjem pouzdano provjerenih termina, dopuštajući Prva razina izgradnja tezaurusa uz minimalno uključivanje stručnjaka - eksperata za određeno predmetno područje. U radu je dan detaljan prikaz i obrazloženje algoritma. Ispod je Kratki opis algoritam, kao i web aplikacija koja ga implementira.
1. Algoritam za izradu tezaurusa
Predlaže se korištenje predmetnog indeksa specijalizirane enciklopedije (ili više enciklopedija) kao popisa ključnih riječi i izraza za tezaurus. Odabir pojedine enciklopedije vrši stručni stručnjak, a taj odabir ovisi o ciljevima kojima se teži pri izradi tezaurusa. Dakle, za rješavanje složenih ekoloških problema, preporučljivo je koristiti enciklopedije (ili, u nedostatku njih, enciklopedijske rječnike) u fizici, kemiji, geologiji, biologiji, medicini, matematici itd. Uz pravilan odabir, predmetni indeks je sasvim prikladan, ako ne kao potpuni, onda, barem, kao osnovni popis ključnih riječi, koji će se po potrebi proširiti.
Predmetna kazala većine enciklopedija strukturirana su na sličan način - sadrže pojmove koji su nazivi enciklopedijskih članaka, pojmove čije su definicije navedene u člancima, kao i najvažnije rezultate koji se u člancima spominju.
Nazivi enciklopedijskih članaka koriste se kao deskriptori (tj. termini koji su nazivi klasa pojmova bliskih po značenju), a riječi iz predmetnog kazala koje se nalaze u odgovarajućem
članci. Glavna prednost ove metode je što za utvrđivanje vrsta veza između pojmova ne morate biti stručnjak za određeno područje – sasvim je dovoljno opće znanje za razumijevanje teksta enciklopedije – konkretnije informacije potrebne su u postupak klasifikacije pojmova uvijek se može saznati iz određenog članka.
Budući da je tezaurus koji se stvara dizajniran za rad pomoću protokola Z39.50, vrste poveznica uspostavljaju se u skladu s preporukama sheme /l lies, koja razlikuje sljedeće vrste:
VT - veza s matičnim pojmom, odnosno s pojmom šireg značenja;
NT - veza s podređenim pojmom, odnosno s pojmom užeg značenja. Veza VT - NT je međusobno inverzna;
UPORABA - veza s pojmom koji se umjesto njega koristi;
UF - međusobna povratna veza USE;
RT - veza koja definira pojam srodnog značenja;
LE - odnos između jezično ekvivalentnih pojmova;
FE su potpuno identični pojmovi.
Zatim se deskriptori klasificiraju u skladu s odjeljcima određenog predmetnog područja. Izbor pojedinog klasifikatora, kao i izbor enciklopedije, obavlja stručni stručnjak, a u slučaju korištenja više enciklopedija iz različitih tematskih područja, moguće je koristiti više specijaliziranih klasifikatora. Između deskriptora i odjeljaka klasifikatora uspostavljaju se veze oblika NT, RT, LE (FE), a pri razvrstavanju treba koristiti odjeljke, ako je moguće, što je više moguće. niska razina.
Ključnim riječima povezanim s deskriptorom odnosima BT, USE, RT, LE i FE tada se dodjeljuje isti klasifikacijski broj kao deskriptoru. Međutim, to ne isključuje situaciju da ako je deskriptor dodijeljen klasi koja nije najniže razine, tada se tijekom naknadnog rada eksperta termini povezani s deskriptorom VT i USE odnosima mogu dodijeliti razred niže razine. U tom će slučaju navedeni termini sami postati deskriptori.
Kao rezultat toga, svi pojmovi uključeni u predmetno kazalo klasificirani su u skladu s odjeljcima određenog predmetnog područja.
2. Opis web aplikacije
Unatoč tome, proces konstruiranja tezaurusa u skladu s ovom tehnikom uključuje veliku količinu rutinskog rada i, osim toga, zahtijeva sudjelovanje osobe s vještinama programiranja. Stoga je uz metodologiju razvijena i web aplikacija koja ima sučelje jednostavno i podržava sljedeće funkcije:
1) automatski prijevod informacija s digitaliziranih stranica predmetnog indeksa u tablicu baze podataka;
2) isticanje deskriptora u općem popisu pojmova;
3) traženje pojmova povezanih s danim deskriptorom i postavljanje tipova odnosa u skladu sa Zthes shemom.
Važno je napomenuti da za izvođenje svih gore navedenih operacija nisu potrebne vještine programiranja.
Razvijena aplikacija je univerzalna, tj. može se koristiti za izradu tezaurusa različitih tematskih područja. Trenutačno rekonfiguriranje programa iz predmetnog kazala jedne enciklopedije u predmetno kazalo druge (i samo u ovoj fazi procesi za izradu tezaurusa različitih tematskih područja mogu se razlikovati) obavlja programer, ali u tijeku je rad na dopuni program s funkcijama koje korisniku omogućuju izvođenje ove operacije. bez znanja programiranja.
Aplikacija funkcionira na sljedeći način. Obrada digitaliziranih stranica predmetnog kazala provodi se automatski. Korisnik zadaje mjesto tekstualne datoteke s podacima, nakon čega se ona čita red po red i sami pojmovi, kao i podaci o brojevima stranica enciklopedije na kojima se nalaze, unose se u bazu podataka (slika 1.) .
Deskriptori iz opći popis ključne riječi odabire sam korisnik označavajući tražene pojmove u popisu prikazanom na ekranu. \¥ob-app također podržava funkciju ispravljanja moguće greške(slika 2). Podsjetimo, svi pojmovi koji se nalaze u enciklopedijskom članku posvećenom tome smatraju se povezanima s danim deskriptorom.
Kako bi se olakšalo pretraživanje srodnih pojmova, korisniku se prikazuje samo popis ključnih riječi koje se nalaze na istoj stranici kao i deskriptor koji je odabrao (zapravo, u tu svrhu u bazu smo unijeli samo pojmove, ali i informacije o nazivima stranica) . Naravno, budući da članak možda neće zauzimati cijelu stranicu, na popisu će se pojaviti nepotrebni pojmovi. Korisnik, uspostavljajući veze,
Riža. 1. Unos tekstualnih datoteka s pojmovima iz predmetnog kazala
Ne. Stvaranje rječnika deskriptora - Microsoft Internet Explorer !- g
Datoteka Uredi Pogled Favoriti Alati Pomoć
Q Natrag " © " @ |í| & ur Traži ^Favoriti - . V
Adresa; |¡j§ http:^localhost/math_dict/Deskj-_Slovar/Descr/gen_ss.phtml ; V¡¿3 Veze za skok>
fiBár JOQQ- © - I * 1 ]0 l de:*- F
1 Abakus | 1, 13 1111111
2 Abelov automat | 1, 67 1111111
3 Objekt Abelove grupe | 1, 1149 111 1 | |
4 Abelov diferencijal 11.13-15 I 2, 240 111111
5 Abelov diferencijal, baza | 1, 13 1111111
6 Abelov diferencijal, djelitelj | 1, 15 | | | | | 1 |
7 Abelova diferencijalna normala | 1, 14 1111111
8 Abelov diferencijal normaliziran | 1, 14 1111111
9 Abelov diferencijal, polarni period | 1, 14 | | | | | | |
10 Abelov diferencijal, ciklički period | 1, 14 1111111
11 Abelov idempotent 14, 941 1111111
12 Abelov integral 11.15-17 1111111
13 Abelov integral, Abelov teorem | 1, 17 1111111
14 Abelov integral kanonski |1.16||||||
16 Abelov integral, matrica perioda |1,16||||||
15 Abelova integralna normala | 1, 16|||||||
17 Abelov integral, polarni period | 1.16||||||| 1S Abelov integral, ciklički period | 1, 16 | | | | |
19 Abelov potencijal | 2, 239 1111111
20 Abelova grupa 11,17-20 1111111
21 Abelova grupa je potpuno raščlanljiva |1.19||||||
22 Abelova grupa djeljiva | 1, 19|||||||
23 Abelova grupa konačno generirana | 1,18 1111111
24 Abelova grupa, Kulikovljev kriterij | 1, 18 | | | | | |
25 Abelova grupa, nula | 3,1082 1111111
26 Abelova grupa, periodički dio | 1, 18 111 | |
http://locdlhostymath_dict/Deskr_Slovar/Descr/goto, phtml?ss 1+4+1+A+1+3
j5tartApache.bat
I Svoj.NET: PHP Edit
J Adobe Photoshop|| w
^ Lokalni intranet
EN Sh/m K 21:0;
Riža. 2. Popis ključnih riječi i označavanje deskriptora
Riža. 3. Odabir povezanih pojmova
Riža. 4. Uspostavljanje vrsta veza.
će odabrati samo dio ključnih riječi s predloženog popisa, međutim, takva automatizacija značajno smanjuje količinu rutinskog rada (slika 3).
Vrsta veze između deskriptora i ključne riječi pojašnjava se ispunjavanjem odgovarajućeg obrasca (slika 4).
Zaključak
Performanse ovog algoritma i web aplikacije testirane su stvaranjem tezaurusa niza odjeljaka predmetnog područja "Matematika" ("Diferencijalne jednadžbe", "Parcijalne diferencijalne jednadžbe", "Numerička analiza", "Mehanika fluida" itd. .) na temelju predmetnog indeksa "Matematička enciklopedija". Utvrđeno je da je za klasificiranje pojmova i uspostavljanje poveznica među njima dovoljna kvalifikacija prvostupnika (uz sudjelovanje, u rijetkim slučajevima, stručnjaka s akademskim stupnjem za konzultacije). To dokazuje visoku učinkovitost razvijenog algoritma.
Bibliografija
Mikhailov A.I., Cherny A.I., Gilyarevsky P.S. Osnove informatike. M.: Nauka, 1968.
Barakhnin V.B. Izrada tezaurusa za predmetno područje "Matematika" // Mater, conf. "Računalstvo i informacijske tehnologije u znanosti, tehnologiji i obrazovanju." Dio 1. Novosibirsk; Almaty; Ust-Kamenogorsk, 2003. str. 111-115.
Zthes: profil Z39.50 za navigaciju tezaurusom
http://lcweb.loe.gov/z3950/agency/profiles/zthes-04.html
UZORAK
Sin: model, uzorak, primjer, uzorak, standard, norma, mjerenje, uzorak, standard, tipični predstavnik, predložak, matrica, eksperimentalni model, crtež, dizajn, crtež, uzorak, gestalt, okvir
Tezaurus ruskog jezika.
2012Također pogledajte tumačenja, sinonime, značenja riječi i što je UZORAK na ruskom u rječnicima, enciklopedijama i referentnim knjigama:
- UZORAK
HAFDASA 1927 - argentinski automatski pištolj kalibra 22. Bila je vojska... - UZORAK u Ilustriranoj enciklopediji oružja:
ISKUSNO - pojedinačni primjerci bilo kojeg dizajna vatrenog oružja, neprihvaćeni za serijsku proizvodnju... - UZORAK u Ilustriranoj enciklopediji oružja:
MUSKET - američka udarna puška 1849.-1855. 58 kalibra sa cijevi. Duljina 1016... - UZORAK u Ilustriranoj enciklopediji oružja:
PUŠKE - Američka perkusiona puška 1849.-1855. 58 kal. Duljina 838... - UZORAK u Ilustriranoj enciklopediji oružja:
70 - Čehoslovački automatski pištolj kalibra 7, 65 ... - UZORAK u Ilustriranoj enciklopediji oružja:
63 - Poljski puškomitraljez s petnaest i dvadeset pet metaka kalibra 9 mm. Duljina s kundakom 583 mm, bez kundaka 330 mm. Težina … - UZORAK u Ilustriranoj enciklopediji oružja:
61 - čehoslovački puškomitraljez s deset i dvadeset metaka kalibra 7,65 mm. Duljina s kundakom 513 mm, bez kundaka 269 mm. ... - UZORAK u Ilustriranoj enciklopediji oružja:
58 P - čehoslovački mitraljez s trideset metaka kalibra 7,62 mm. Duljina 820 mm. Težina 3140... - UZORAK u Ilustriranoj enciklopediji oružja:
58 V - čehoslovački mitraljez s trideset metaka kalibra 7,62 mm. Duljina s kundakom 820 mm, bez kundaka 635 mm. Težina … - UZORAK u Ilustriranoj enciklopediji oružja:
52 -1. Vidi CHZET-513. 2. Čehoslovački automatski samopuneći karabin s deset metaka kalibra 7,62 mm. Duljina 1003 mm. Težina 4100... - UZORAK u Ilustriranoj enciklopediji oružja:
50 - čehoslovački automatski pištolj kalibra 7,62 mm. Mala kopija CHZET-513. Bio na servisu... - UZORAK u Ilustriranoj enciklopediji oružja:
25 - 1. Čehoslovački puškomitraljez s dvadeset četiri i četrdeset metaka kalibra 9 mm. Duljina s kundakom 686 mm, bez kundaka 445 mm. Težina … - UZORAK u Ilustriranoj enciklopediji oružja:
23 - čehoslovački puškomitraljez s dvadeset četiri i četrdeset metaka kalibra 9 mm. Duljina 686 mm. Težina 3270... - UZORAK u Ilustriranoj enciklopediji oružja:
16/33 - Čehoslovački ponavljajući karabin s pet metaka kalibra 7,92 mm. Duljina bez bajuneta 995 mm, sa bajunetom 1305 mm. Težina … - UZORAK
INDUSTRIJSKI - pogledajte INDUSTRIJSKI UZORAK... - UZORAK u Rječniku ekonomskih pojmova:
- okvirni pojedinačni primjerak proizvoda koji se koristi za reklamu, na izložbama, u svrhu upoznavanja, pokazivanja potencijalnim... - UZORAK V Enciklopedijski rječnik:
, -ztsa, m. 1. Pokazni ili probni proizvod; uzorak (2 vrijednosti). 06 uzoraka tla. Uzorci minerala. Uzorci proizvoda. Industrijski o. (novi,... - UZORAK u Velikom ruskom enciklopedijskom rječniku:
INDUSTRIJSKI UZORAK, vidi Industrijski... - UZORAK u potpunoj naglasnoj paradigmi prema Zaliznyaku:
uzorak"c, uzorci", uzorak", uzorak"u, uzorak", uzorak"m, uzorak"c, uzorci", uzorak"m, uzorak"mi, uzorak", ... - UZORAK u Popularnom objašnjavajućem enciklopedijskom rječniku ruskog jezika:
-zts "a, m. 1) (obično nešto) Indikativni ili probni primjerak nekog proizvoda, materijala; dio neke tvari, proizvoda, daje ideju ... - UZORAK u Rječniku za rješavanje i sastavljanje skandera:
… Za … - UZORAK u Tezaurusu ruskog poslovnog vokabulara:
- UZORAK u Abramovljevom rječniku sinonima:
uzorak, prototip, prototip, tip, prototip, ideal, model, original, primjer; model. Prot. . Pogledajte idealno, primjer,... - UZORAK u rječniku ruskih sinonima:
Sin: model, uzorak, primjer, uzorak, standard, norma, mjerenje, uzorak, standard, tipični predstavnik, predložak, matrica, eksperimentalni model, crtež, dizajn, crtež, uzorak, ... - UZORAK u Novom objašnjavajućem rječniku ruskog jezika Efremove:
m. 1) Približna, indikativna ili probna kopija nečega. proizvod, materijal itd. 2) a) Demonstrativna primjer nečega. (neke osobine, ponašanje,...
3.1. Koncept tezaurusa
Tezaurus (od grč. θήσαϋροξ - blago, zaliha) ili ideografski rječnik (od grč. idea - pojam, prikaz, zamisao i grapho - pišem, opisujem) - u suvremenoj lingvistici: 1) posebna vrsta rječnika općeg ili posebnog rječnika, rječnika općeg ili posebnog rječnika, rječnika općeg ili posebnog rječnika, rječnika općeg ili posebnog rječnika, rječnika općeg ili posebnog rječnika. koji sadrži semantičke odnose između leksičkih jedinica; 2) rječnik za traženje riječi na temelju njezine semantičke povezanosti s drugim riječima; 3) određeni način organizacije (rasporeda) riječi u rječniku; 4) način organiziranja leksičkog sastava, koji vam omogućuje ekonomično "modeliranje svijeta".
U prvom, izvornom značenju – spremište, blago, termin tezaurus upotrijebio je L.V. Shcherba u članku “Iskustvo opće leksikografije” (treća opozicija: tezaurus - obični (objašnjavajući ili prijevodni) rječnik). Znanstvenik piše: “Kad se kaže tezaurus, danas se najčešće misli na “Thesaurus linguae latinae”, pothvat pet njemačkih akademija, koji je započeo davne 1900. godine i do sada je dovršen s izostavljanjima samo do slova M. Značajka Ova vrsta rječnika sadrži sve riječi koje se nalaze u dati jezik barem jednom, te da se ispod svake riječi navode apsolutno svi citati iz tekstova dostupnih na određenom jeziku. Osnova gornje opozicije - tezaurus - obični (objašnjavajući ili prijevodni) rječnik - je opozicija "jezična građa" i "jezični sustav" - pojmovi koje sam pokušao potkrijepiti u svom članku "O trostrukom aspektu jezičnih pojava i o eksperimentu u lingvistici.”
Drugo značenje ovog pojma povezuje se s nadaleko poznatim rječnikom-tezaurusom “Thesaurus engleske riječi i izrazi” P.M. Roger (Roget's Thesaurus of English Words and Phrases, 1852) i njegov nastavak, rječnik O.V.
U ovom tumačenju pojam tezaurus označava određeni način organiziranja i sređivanja leksičkog sastava u rječniku (vidi treće značenje pojma).
Četvrto značenje pojma tezaurus povezano je s univerzalnim priznanjem ove metode organiziranja leksičkog sastava, koja omogućuje ekonomično "modeliranje svijeta". S ove točke gledišta, rječnik tezaurusa je “sustavno sređivanje vokabulara bilo kojeg znanstvenog ili tehničkog područja, au većini opći pogled- opći književni vokabular, štoviše, cjelokupni rječnik određenog jezika.”
Prema Yu.N. Karaulova, tezaurus općeg jezika, fiksirajući u strukturi i odnosima svojih naslova, odjeljaka, zona, područja široke mogućnosti neverbalnog povezivanja ideja, osigurava prikaz ljudskih vrijednosti.
A.N. Baranov i D.O. Dobrovolsky u predgovoru "Od urednika" svom "Rječniku-tezaurusu modernih ruskih idioma" daje tezaurus sljedeća definicija- posebna vrsta rječnika koja se od drugih (posebno objašnjavajućih, dvojezičnih itd.) razlikuje po načinu organizacije jezične građe. U tezaurusu jezične jedinice nisu prikazane abecednim redom, kao u običnom rječniku, već su grupirane prema značenju.
L.P. Krisin tezaurus (ideografski rječnik) naziva posebnom vrstom eksplanatornog rječnika, rječnika “naprotiv”. “Ako je u rječniku objašnjenja, piše znanstvenik, “natuknica” rječničke natuknice riječ, a sadržaj rječničke natuknice je tumačenje značenja te riječi, onda je u ideografskom rječniku “natuknica” značenje, ideja (otuda i naziv ove vrste rječnika - ideografski), a sadržaj rječničke natuknice je popis riječi koje izražavaju određeno značenje. A ako je rječnik s objašnjenjima nezamjenjiv alat za razumijevanje teksta, onda se ideografski rječnik može koristiti za generiranje teksta: vrlo često osoba želi izraziti određenu misao, ali ne može pronaći riječi prikladne za to; ideografski rječnik olakšava te pretrage. Postoje dvije glavne vrste tezaurusa:
lingvistički tezaurus - rječnik koji sadrži popis riječi prirodnog jezika odabranih kao rezultat smislene analize tekstova i sistematiziranih u skladu s prihvaćenim klasifikacijskim sustavom;
statistički tezaurus - rječnik za pretraživanje informacija koji sadrži popis riječi odabranih kao rezultat statističke analize tekstova o određenoj temi i grupiranih u rječničke natuknice na temelju učestalosti supojavljivanja tih riječi u istim tekstovima.
Tezaurusi traženja informacija (IRT) olakšavaju traženje informacija tijekom njihove automatske obrade. IPT maksimalno otkriva semantičke odnose između leksičkih jedinica. Kao što je navedeno u GOST-u o IPT-u, "jednojezični tezaurus za pretraživanje informacija je kontrolirani i promjenjivi rječnik leksičkih jedinica, temeljen na vokabularu jednog prirodnog jezika, koji prikazuje semantičke odnose između leksičkih jedinica i namijenjen je obradi i pronalaženju informacija."
Osnovna jedinica IPT-a su deskriptorski pojmovi. Abecedni, leksičko-semantički dio IPT-a skup je deskriptorskih članaka.
Opisni rječnici namijenjeni su potpunom opisivanju vokabulara određenog područja i bilježenju svih uporaba u njemu; bilježe sve dostupne relevantne slučajeve. Tipičan primjer Opisni rječnik je "Objašnjavajući rječnik živog velikoruskog jezika" V.I. Dahl (prvo izdanje u četiri sveska objavljeno je 1863.-1866.). Cilj njegovog tvorca nije bio standardizirati jezik, već potpuno opisati cjelokupnu raznolikost velikoruskog govora - uključujući njegove dijalektalne oblike narodnog jezika.
Svaki rječnički unos deskriptora počinje deskriptorom, u kojem su sinonimi ovog deskriptora, kao i druge leksičke jedinice povezane s glavnim deskriptorom rodno-vrstskim ili asocijativnim odnosima, navedeni u nastavku u članku GOST-a.
Stoga su tezaurusi, posebice u elektroničkom obliku, jedan od učinkovitih alata za opisivanje pojedinih tematskih područja.
Tezaurus se rijetko nalazi u svom čistom obliku. U pravim tezaurusima izvorna ideja je pojednostavljena ili strana, ali potencijalno neophodna, informacija dodana je korisniku. Danas su najpoznatiji “Ruski semantički rječnik” Yu.N. Karaulova, “Rječnik identičnih imena” N.Yu. Shvedova, “Tematski rječnik ruskog jezika” L.G. Smekhova i drugi.
Sažetak. Pojam tezaurusa L.V. Shcherba ga je koristio u odnosu na rječnik, koji je bilježio, ako je moguće, sve kontekste u kojima se navedena riječ pojavljuje. Karakteristična je značajka tezaurusa da navode sve riječi koje se barem jednom pojavljuju u određenom jeziku, a ispod svake riječi navode se svi citati iz tekstova dostupnih na tom jeziku. Sadržaj rječnika tezaurusa je jezična građa, a redovnog rječnika je jezična građa i jezični sustav (termini L. V. Shcherba).
Ova karakteristika nadopunjuje se unakrsnim vezama raznih vrsta - često paradigmatskim (sinonimnim ili antonimskim), koje ukazuju na zajedništvo ili suprotnost značenja. Osim toga, razne vrste udruga. veze (tj. sintagmske veze).
Dakle, zadatak tezaurusa (ideografskog rječnika) je dati ideju o semantičkoj organizaciji određenog presjeka jezičnog materijala, pokazujući glavna semantička polja, njihovu unutarnju strukturu i vanjske veze. Tezaurus je jasna demonstracija sustavne prirode jezika, omogućavajući uvid u mnoge vrste odnosa koji povezuju pojedinačne jezične jedinice i skupine jedinica.
3.2. Povijest predstavljanja pojmovnog znanja o svijetu u obliku tezaurusa
Potreba za raspoređivanjem riječi prema sličnosti, susjedstvu i analogiji njihovih značenja osjećala se kroz vidljivu povijest ljudske misli.
Da bismo pratili podrijetlo ideje o predstavljanju konceptualnog znanja o svijetu u obliku tezaurusa, pomoći će nam okretanjem povijesti sastavljanja tezaurusa (ideografskih rječnika).
Tako je u praskozorju civilizacije, kada su ljudi svoje misli mogli izražavati pisanim putem samo uz pomoć ideograma i simbola, vjerojatno jedini mogući rječnik bio onaj u kojem su riječi bile raspoređene u tematske skupine. Tadašnjem leksikografu jednostavno je bilo teško pronaći drugi kriterij za klasifikaciju riječi osim odnosa koji postoje u samoj stvarnosti.
Nažalost, nemamo dokaza jesu li narodi koji su koristili ideografsko pismo doista imali takve rječnike. Među najstarijim pokušajima ideografske klasifikacije koji su nam poznati je Attikai Lexeis grčkog gramatičara, ravnatelja Aleksandrijske knjižnice, Aristofana iz Bizanta (umro 180. pr. Kr.).
U II stoljeću. n. e. pojavljuje se kapitalno djelo “Onomastikon”, koje je na građi grčkog jezika sastavio leksikograf i sofist Julije Poluks (pravim imenom Polideuk), rodom iz egipatskog grada Naukratisa. Yu. Pollux je napisao nekoliko djela, ali samo je "Onomasticon" stigao do nas (Pollux Yu. Onomasticon. M., 1956).
Onomastikon se sastoji od 10 knjiga. Knjige su u biti zasebne rasprave i sadrže najvažnije riječi vezane uz određenu temu. Dakle, prva knjiga govori o bogovima i kraljevima; u drugom - o ljudima, njihovim životima i fiziološkoj strukturi; u trećem - o rodbinskim i građanskim odnosima itd. Riječi uvrštene u rječnik popraćene su kratkim tumačenjima. U moderno doba rječnik je prvi put objavljen 1502. godine u Veneciji.
Između 2. i 3.st. n. e. Objavljen je prekrasan sanskrtski rječnik “Amarakosha” (Amarakosha. Pariz, 1839.). Njegov autor je staroindijski pjesnik, gramatičar i leksikograf Amara Sina, koji je nazvan “jednim od devet bisera koji krase prijestolje Vikramaditye”. Amarakosha prevedeno na ruski znači riznica Amara. Rječnik sadrži 10 tisuća riječi. Radi boljeg pamćenja tumačenja značenja riječi, rječničke natuknice konstruirane su u obliku pjesama. Sva rječnička građa podijeljena je u 3 knjige. Svaka knjiga uključuje nekoliko poglavlja, a poglavlje je pak, ako je potrebno, podijeljeno na nekoliko odjeljaka. Prva knjiga posvećena je nebu, bogovima i svemu što je u neposrednoj vezi s njima. Druga knjiga sadrži riječi vezane uz zemlju, naselja, biljke, životinje i ljude (prvo se čovjek promatra kao živo biće, a zatim kao društveno biće; pred očima nam se pojavljuje cjelokupna kastinska struktura autorova suvremenog društva; svećenici , kao Božji povjerenici, nalaze se na samom vrhu, a ispod su vojnici i kraljevi, još niže su zemljoposjednici, a na samom dnu zanatlije, žongleri, sluge itd.). Treća je knjiga strogo lingvistička, što je jasno iz naslova njezinih šest poglavlja.
Rječnik je postao poznat europskim znanstvenicima tek krajem 18. stoljeća, kada je njegov prvi dio objavljen u Rimu 1798. godine. U cijelosti ga je s prijevodom na engleski 1808. objavio engleski sanskrtolog G.T. Colebrooke (N.T. Colebrooke). Godine 1839. pojavio se njegov francuski prijevod, koji je napravio A.L. Delonchamps (A.L. Deslongchamps). Daljnji razvoj ideje semantičke klasifikacije vokabulara povezan je s problemom tzv. svjetskog jezika.
Sažetak. To je, najopćenitije rečeno, prva faza u razvoju tradicije ideografske klasifikacije vokabulara. Ovu fazu možemo nazvati pretpoviješću ideografskih rječnika. Sada je preporučljivo obratiti se na modernu klasifikaciju rječnika tezaurusa.
Lako je vidjeti koliko se opisana djela razlikuju od abecednih rječnika. Ako je u abecednim rječnicima prezentacija riječi regulirana tako konvencionalnim i visoko neutralnim instrumentom kao što je abeceda, onda pri izradi ideografskog rječnika presudno stječe svjetonazor samog leksikografa.
3.3. Načela klasifikacije rječnika-tezaurusa
Kao što je gore već pokazano, problem sastavljanja klasifikacije tezaurusa nije nov i već nekoliko desetljeća privlači pozornost niza domaćih i stranih jezikoslovaca (C. Marello, V. V. Morkovkin, L. P. Stupin, V. V. Dubichinsky, itd.). ). Rezultat istraživanja u ovom području bila je izrada alternativnih klasifikacija ovih leksikografskih djela. Jedna od najnovijih klasifikacija temelji se na sljedećim kriterijima: a) vrsti semantičkih veza između vokabularnih jedinica; 2) volumen vokabulara; 3) generalizacija vokabulara; 4) razvoj značenja leksema; 5) gramatičko-stilska kvalifikacija leksema; 6) demonstracija funkcioniranja leksema; 7) broj zastupljenih jezika; 8) vrsta semiotičkih sredstava kojima se semantiziraju leksemi. Ova klasifikacija temelji se na prethodno kreiranim klasifikacijama O.M. Karpova i I. Burkhanova (Burchanov I. On the Ideographic Description of Stylistically and Pragmatically Relevant Aspects of Lexical Meanings. London, 1996.); terminologija koja se koristi pri klasifikaciji uvodi se u leksikografski aparat
V.V. Morkovkin, Yu.N. Karaulov, K. Marello. Kriterije klasifikacije formulirao je O.M. Karpova. Pritom C. Marello razlikuje tri vrste tezaurusa:
kumulativne, koje su skupine riječi bez definiranja njihova značenja;
definitivan, tumačenje svake leksičke jedinice skupine riječi;
dvo- i višejezični tezaurusi za putnike (Marello C. Thesaurus//W.D.D. 1990. V. 2. P. 1083).
Kumulativni tezaurusi ne samo da pružaju mogućnost pronalaženja razumljivije, točnije, stilski ispravnije riječi u situaciji boravka u određenom semantičkom polju, već postaju i osnova za formiranje tematskih računalnih banaka podataka.
Definitivni tezaurusi mogu uključivati, uz definicije značenja, etimološke podatke i citate iz književnih djela, što pokazuje izravnu enciklopedijsku usmjerenost ove vrste tezaurusa. Osim toga, rječnici ovog tipa upoznaju korisnika s potrebnog sustava pojmova, objašnjavaju bit, sličnosti i razlike pojmova, njihove paradigmatske i sintagmatske veze, ponekad daju informacije o izgovornim, gramatičkim, tvorbenim i drugim mogućnostima leksičkih jedinica koje označuju te pojmove.
Dvojezični i višejezični tezaurusi za putnike obično se izrađuju pomoću tematske cjeline: brojevi, hrana, prijevoz, hotel itd. s prijevodnim ekvivalentima dva ili više jezika.
Kako bi se što potpunije prikazale vrste postojećih rječnika tezaurusa, kreirana je klasifikacija na više razina. Prvo, prema vrsti semantičkih veza između vokabularnih jedinica, tezaurusi su podijeljeni u tri velike klase:
1. Asocijativni tezaurus (terminologija Yu.N. Karaulova
2. Analogni tezaurus (terminologija V.V. Morkovkina
3. Ideografski (ideološki) tezaurus (terminologija L.V. Shcherba, V.V. Morkovkin. Tri gore navedene vrste tezaurusa odražavaju sljedeće vrste semantičke veze leksema, odnosno:
1. Semantičko-sintaktičke veze, na temelju kojih
riječi se spajaju u skupine ili parove, unaprijed određene u svom pojavljivanju i postojanju dvostrukim vezama: semantičkim i sintaktičkim. Značenjske veze između riječi uspostavljaju se uglavnom između glagola i pridjeva koji u rečenici imaju predikativnu funkciju te imenica, npr.
a) između radnje i organa (instrumenta) kojim se vrši: uhvatiti - ruka, vidjeti - oko, plivati - čamac i sl.;
b) između glagola radnje koji zahtijevaju jedan subjekt i subjekt: lajati - pas, njištati - konj i sl.; c) između glagola i izvjesnog gramatičkog dodatka, koji prvi zahtijevaju: cijepati - drva, jesti - jelo i t.
Dakle, asocijativni tezaurus je rječnik-tezaurus koji organizira leksičke jedinice na temelju semantičkih i sintaktičkih veza koje postoje među njima i raspoređuje skupine u skladu s grafičkim oblikom središnjih riječi.
2. Leksičko-semantičke veze. Grupiranje s ovom vrstom veze događa se prema glavnom obilježju riječi - leksičkom značenju. Pritom se uzimaju u obzir i leksičko-gramatičke veze u čijem se obliku ostvaruju pojedinačna značenja riječi.
Dakle, analogni tezaurus je leksikografski priručnik, čija je glavna jedinica makrostrukture leksičko-semantička skupina; skupine su sistematizirane abecednim redom semantičkih dominanti.
3. Predmetne ili tematske veze, gdje do spajanja riječi u jednu skupinu dolazi zbog sličnosti ili zajedništva funkcija predmeta i procesa koji se označavaju riječima: predmeti
kućanski predmeti, dijelovi tijela, vrste odjeće, građevine itd.
Dakle, ideografski tezaurus je leksikografsko djelo koje predstavlja leksičke jedinice kao dio predmetnih (tematskih) skupina i organizira ih u hijerarhijsku strukturu dizajniranu da predstavlja konceptualizirano znanje o svijetu.
U okviru istog kriterija dalje dijelimo tipove. Dakle, ideografski tezaurus predstavljaju sljedeće 4 vrste:
Zapravo ideografski tezaurus.
Tematski rječnik.
Sustavni rječnik.
Tematsko-sustavni rječnik
Sam ideografski tezaurus posebna je vrsta ideografskog rječnika, čija je makrostruktura organizirana u skladu s apriornom sinoptičkom kartom superponiranom na leksički sastav jezika. Za razliku od drugih vrsta ideografskih rječnika, sam ideografski tezaurus karakterizira logična i strogo uređena klasifikacijska struktura stvorena na temelju znanstvene taksonomije, čak i ako je opći vokabular podložan leksikografskom opisu (New Webster "Thesaurus. Landoll, 1991.).
Predmetni rječnik je posebna vrsta ideografskog tezaurusa, čija je glavna jedinica makrostrukture tematska skupina, uključujući lekseme kombinirane na temelju klasifikacije njihovih denotata (referenata) i razmatrane sa stajališta usklađenosti s određenom temom.
Sustavni rječnik je posebna vrsta ideografskog tezaurusa čija je klasifikacijska struktura namijenjena predstavljanju stvarnih semantičkih odnosa koji postoje između leksičkih jedinica jezika. Klasifikacijska struktura u svojoj srži predstavlja leksičko-gramatičku klasifikaciju vokabulara, odnosno njegovu paradigmatsku strukturu, opisanu sa stajališta subordinacije i kompozicije.
Tematsko-sustavni rječnik je posebna vrsta ideografskog rječnika, koji je kombinacija tematskog i sustavnog rječnika.
Sažetak. Razmatrana klasifikacija lingvističkih tezaurusa uključuje sljedeće vrste rječnika: analogni tezaurus (terminologija V.V. Morkovkina); ideografski (ideološki) tezaurus (terminologija L.V. Shcherba i V.V. Morkovkin); izv. prof. tezaurus (terminologija Yu.N. Karaulova). Sljedeći će biti predstavljen pop. otkrivaju se tezaurusi i njihove značajke.
3.4. Popularni tezaurusi i njihove značajke
Najpoznatiji od dostupnih rječnika-tezaurusa, kojemu i sam pojam duguje svoje postojanje, nastao je na materijalu na engleskom; ovo je tezaurus koji se stalno ponovno tiska P.M. Tezaurus engleskih riječi i izraza Rogera Rogeta (1852.).
Važno je napomenuti da je autor Tezaurusa engleskih riječi i izraza u potpunosti iskoristio dotadašnje iskustvo. “Načelo koje me vodilo pri klasifikaciji riječi”, piše P.M. Roger, isti je onaj koji se koristi u klasifikaciji pojedinaca u raznim područjima prirodne povijesti. Stoga odjeljci koje sam istaknuo odgovaraju prirodnim obiteljima botanike i zoologije, a nizovi riječi zacementirani su istim odnosima koji ujedinjuju prirodne nizove biljaka i životinja."
P.M. Roger je vjerovao da je uvjerljiva klasifikacija riječi prema njihovim značenjima nemoguća sve dok se predmeti stvarnosti koji se nazivaju tim riječima pravilno prouče i organiziraju. Stoga svoj rad započinje dijeljenjem konceptualnog polja engleskog jezika na četiri velika klasa: apstraktni odnosi, prostor, materija i duh (um, volja, osjećaji). Ove klase se dalje dijele na određeni broj rodova, koji se pak dijele na određeni broj vrsta.
Među nedostatcima ideografskog rječnika P.M. Znanstvenici Rogeru pripisuju sljedeće: 1) ne sasvim uvjerljivu nomenklaturu glavnih pojmovnih klasa; 2) apstraktna logika prevladava nad prirodnim vezama riječi; 3) relativna neugodnost korištenja (u velikoj mjeri ovaj nedostatak ispravljeno u kasnijim izdanjima).
U suvremenoj ruskoj leksikografiji postoji nekoliko rječnika koji bi se trebali klasificirati kao rječnici-tezaurusi (ideografski rječnici). Ovo je, na primjer, stvoreno pod vodstvom Yu.N. Karaulova “Ruski semantički rječnik”, “Ruski semantički rječnik” uredio N.Yu. Shvedova, “Tematski rječnik ruskog jezika” L.G. Sayakhova, D.M. Khasanova i V.V. Morkovkina, “Rječnik leksičko-semantičkih skupina ruskih glagola”, ur. E.V. Kuznetsova, “Ideografski rječnik ruskog jezika” O.S. Baranova, “Konceptosfera unutrašnji svijet osoba na ruskom jeziku" V.I. Ubiyko, sveobuhvatni obrazovni rječnik „Leksička osnova ruskog jezika” pod vodstvom V.V. Morkovkina.
Upoznajmo neke od njih.
Rječnik-tezaurus modernih ruskih idioma” uredio A.N. Baranova i D.O. Dobrovolsky uključuje četiri glavna dijela: 1) sinopsis; 2) legenda; 3) glavni dio Rječnika-tezaurusa; 4) pokazivači. Svrha sinopsisa je dati opću ideju o strukturi glavnog dijela tezaurusa. Navodi sve taksone s podtaksonima i odgovarajućim paradigmatskim referencama. Glavni dio Rječnika tezaurusa je zbirka rječničkih natuknica, grupiranih u skupine (taksone) i podskupine (subtaksone) u skladu sa značenjem idioma opisanih u njima. Svaki članak sadrži idiom i primjere njegove uporabe u suvremenom ruskom jeziku. Sinopsis, Legenda, Indeksi servisni su dijelovi navedenog Rječnika-tezaurusa koji korisniku pružaju mogućnost brzog i učinkovitog rada. Legenda se koristi u slučajevima kada primjeri upotrebe idioma nisu potrebni, jer reproducira sve informacije osim primjera. Zapravo, ovo je vokabular Rječnika. Jedinice vokabulara su leme. Lema u ovom slučaju predstavlja idiom u njegovom izvornom (rječničkom) obliku i uključuje, ako je moguće, sve njegove značajne varijante. Na primjer, idiom mirovati dio je leme označiti vrijeme, mirovati, klizati na mjestu.
Rječnik sadrži dva pokazivača. Na kraju knjige nalazi se članak “Teorijski koncept rječnika-tezaurusa moderne ruske ideomatike”, koji detaljno analizira znanstvene značajke ovog projekta.
“Ruski semantički rječnik”, nastao pod vodstvom Yu.N. Karaulova uključuje 10 tisuća ruskih riječi, koje su podijeljene u 1600 pojmovnih skupina. Identifikacija skupina temelji se na ponovljenim elementima tumačenja riječi u rječnicima objašnjenja: na primjer, "radnja", "svojstvo", "alat" itd.
“Ruski semantički rječnik”, nastao pod vodstvom akademika N.Yu. Shvedova, temelji se na malo drugačijim načelima karakterističnim za sastavljanje i ideografskih i objašnjavajući rječnici. Prvo, sve riječi u jeziku podijeljene su ovdje u četiri klase: 1) indikativne jedinice (zamjenice), 2) imenovanje (smišljene riječi), 3) stvarni konektori (veznici, prijedlozi, povezujući glagoli), 4) klasificiranje (modalne riječi , čestice, uzvici). Drugo, unutar svake klase sve su riječi raspoređene prema dijelovima govora. Treće, unutar svakog dijela govora identificiraju se skupovi i podskupovi na temelju tematske bliskosti ili, obrnuto, suprotnosti značenja riječi.
DUDEN je knjiga sa slikama (crtežima) na lijevoj strani (prema različitim softverima) s numeriranim dijelovima (sve do najmanjeg). S desne strane ovaj numerirani popis prati naslov (čak i na dva jezika). Na primjer, željeznička oprema, stanice i tračnice nacrtane su na cijeloj stranici. Desno su nazivi strijela, semafora, štaka itd.
“Tematski rječnik ruskog jezika” L.G. Sayakhova, D.M. Khasanova i V.V. Morkovkina sadrži 25 tisuća leksičkih jedinica, grupiranih u tri velike klase: "Čovjek", "Društvo", "Priroda", koje se postupno granaju u manje podklase. Na primjer, u klasi “Čovjek” postoje potklase “Ljudsko tijelo i organizam”, “Ljudski život”, “ Izgled, izgled osobe”, “Emocionalni izgled osobe” itd. Svaki od podrazreda se pak dijeli na još specifičnije: “Emocionalni svijet osobe” - “Duševna svojstva osobe” - “Temperament” , “Karakter” - “Opće osobine karaktera” itd. Značenje i uporaba riječi koje pripadaju svakom razredu ilustrirani su najčešćim izrazima. Na primjer, riječ "smijeh", koja je u podskupini "izražavanje osjećaja, emocija" klase "Čovjek", popraćena je naznakom takvih kombinacija s ovom riječi kao što su veseli smijeh, radosni smijeh, dječji smijeh, prasak u smijeh itd.
Sažetak. Jedan od učinkovitih alata za opisivanje pojedinih tematskih područja, posebice u elektroničkom obliku, jesu tezaurusi.
Pojam tezaurus odavno se široko koristi u lingvistici za označavanje posebne vrste rječnika, koji u jednom ili drugom stupnju odražava "sliku svijeta", "jezični model svijeta" (prema Yu.N. Karaulov). Tezaurus kao “riznica” porastao je u semantičkom opsegu i dobio novo značenje. Počeli su ga nazivati rječnikom koji ne samo da u sebe upija sva leksička bogatstva jezika, već ih organizira na određeni logičko-sustavan način. U rječniku tezaurusa riječi se spajaju u skupine, a to sjedinjavanje događa se na temelju sposobnosti pojedine riječi da prenese određeni pojam.
Rječnik tezaurusa oduvijek se u lingvistici smatrao nekom vrstom univerzalnog sustava koji osigurava pohranjivanje kolektivnog (za određeno društvo) znanja o svijetu u verbalnom obliku. Za razliku od drugih rječnika, u rječniku tezaurusa to je znanje pohranjeno u strukturiranom obliku koji odražava naše ideje o "strukturi svijeta".
Najpoznatiji i najpopularniji tezaurus trenutno su engleski Roger's Thesaurus, Ideografski rječnik ruskog jezika O.V. Baranova, Ruski semantički rječnik Yu.N. Karaulova, Ruski semantički rječnik akademika N.Yu. Shvedova, DUDEN, Tematski rječnik ruskog jezika L.G. Sayakhova, D.M. Khasanova i V.V. Morkovkina.