Din ce în ce mai mult, în numeroase proiecte, cărți, broșuri, resurse de pe Internet, se poate găsi conceptul de „tezaur”. Ca un fenomen misterios, sperie prin necunoscutul lui, pentru că este mult mai ușor să spui „dicționar” decât să folosești o definiție ciudată.
Tezaur: ce este? Cum este diferit de un dicționar obișnuit? Să încercăm să studiem aceste probleme mai detaliat și într-un mod accesibil.
Interpretarea termenului
Inițial, conceptul de tezaur a fost considerat din punctul de vedere al unui dicționar, reprezentând vocabularul limbii cu exemple de utilizare în text.
Ozhegov interpretează tezaurul ca un dicționar al unei limbi specifice care reflectă pe deplin vocabularul, în timp ce Efremova consideră acest fenomen din punctul de vedere al unui set sistematizat de date într-o anumită zonă de cunoaștere.
Cea mai specifică definiție este folosită în filologie, unde tezaurul este înțeles ca o componentă a unui tip de vocabular, unde toate semnificațiile cuvintelor sunt legate între ele prin relații semantice și reflectă relațiile cheie ale conceptelor dintr-o anumită zonă.
După cum vedem, este destul de dificil să răspundem la întrebarea: „Tezaur: ce este?” fără ambiguitate. Pentru un studiu mai restrâns al termenului, luați în considerare istoria originii, tipurile și relațiile unităților lexicale într-un dicționar de acest tip.
Istoria originii
Părintele fondator al tezaurilor este considerat a fi fizicianul englez Roger, acesta fiind cel care în 1852 l-a sistematizat prin distribuirea în grupuri. În acest caz, fiecare grup a fost reprezentat de numele conceptului, iar apoi au existat sinonimele sale pentru anumite părți de vorbire, liste de nume înrudite, precum și referiri la numele altor categorii. Ideea unei astfel de clasificări a fost foarte valoroasă, deoarece dicționarul era considerat cel mai natural, descria vocabularul limbii în cea mai mare măsură. Cu toate acestea, ar putea fi folosit ca o căutare rapidă a conceptelor importante. De la momentul primului tezaur și până în prezent, a existat o transformare regulată a acestui tip de dicționar, care este folosit în multe domenii ale cunoașterii și este larg popular în întreaga lume. Totodată, studiul temei: „Tezaur: ce este?” relevante în multe instituții de învățământ.
Până acum, tezaurile rămân cel mai popular mod de a descrie cunoștințele în orice domeniu care este necesar pentru o percepție umană eficientă.
Relații de cuvinte în tezaur
Cele mai comune relații din tezaurul clasic sunt:
- Sinonimia este un fenomen în care cuvintele unei părți de vorbire sunt legate, care sunt similare în sens lexical. De exemplu: putere-patrie, brigadă-detașament, stacojiu - roșu etc.
- Antonimia este o conexiune între cuvintele unei părți de vorbire care au sensul lexical opus. De exemplu: tăcere - bubuit, blând - aspru.
- Hiponimia (hiponimia) este o relație cheie în scopul descrierii substantivelor. Hiperonimul are un înțeles lexical larg, exprimă denumirea generică, generală, a unei clase (mulțimi) de obiecte, obiecte și anume, proprietățile și atributele acesteia. Iponimul are un înțeles restrâns; denumește un obiect (semn, proprietate) ca element al unui anumit set sau clasă. Pentru ca aceste relații să devină clare, vă prezentăm cel mai simplu exemplu... Cuvintele fiara și tigrul sunt înrudite între ele, cu numele comun - fiara- este un hiperonim în raport cu hiponimul tigru.
- Meronimia (paronimia) - relații pentru substantive, se formează după principiul „parte – întreg”. Ca exemplu, luați în considerare cuvintele aeronave, tren de aterizare, hubloul... În acest caz, denumirea generală a transportului este un holonim (întreg, nume), iar părțile sale constitutive sunt meronime.
- Corolar (relații între verbe). De exemplu, cuvintele du-te si vino legate de proces și de consecința (rezultatul) acestuia.
- Motivul (valabil și numai pentru verbe). Luați în considerare un exemplu de astfel de relație, luați cuvintele: fii bolnav - sari peste... În acest caz, motivul este urmărit - să sară peste, pentru că au existat probleme de sănătate.
Ce este tezaurul, vom vedea din exemplul următor.
Patul este un dispozitiv pentru dormit.
[hiperonim]: mobilier
[meronim]: acasă
[sinonim]: pat, pat.
Acesta este doar un exemplu clasic de tezaur al limbii ruse, dar toate dicționarele de acest tip sunt construite conform acestui principiu.
Funcții de tezaur
Dicționarul tezaur are funcții importante sociale, de comunicare, științifice și alte funcții.
El este:
- o sursă de cunoștințe speciale într-un domeniu larg sau restrâns, un mod de ordonare, descriere a termenilor;
- instrument de căutare în fluxul de informații;
- un instrument pentru analiza manuală a documentației în motoarele de căutare;
- un instrument pentru indexarea automată a textelor complexe.
Tipuri de tezauri
Varietatea dicționarelor necesită nu numai luarea în considerare a întrebării: „Tezaur: ce este?”, ci și atenție la tipuri. Acest lucru ne va ajuta să înțelegem mai bine caracteristicile acestui tip de dicționare.
Concluzie
Sperăm că am putut explica într-un limbaj accesibil ce este un tezaur. Exemplele facilitează înțelegerea modului în care diferă de alte dicționare. De asemenea, am evidențiat problema tezaurilor de regăsire a informațiilor, care sunt utilizate pe scară largă de sistemul informațional pentru a căuta și organiza rapid milioane de titluri.
Tehnologia de calcul
Volumul 12, Numărul Special 2, 2007
TEHNOLOGIE PENTRU CREAREA UNUI TEZAUR AL UNUI AREA SUBIECTULUI PE BAZA INDEXUL SUBIECTULUI AL ENCICLOPEDIEI
V. B. Barahnin
Institutul de Tehnologii Computaționale SB RAS, Novosibirsk, Rusia
e-mail: [email protected]
Universitatea de Stat V. A. Nekhaeva Novosibirsk, Rusia e-mail: [email protected]
Această lucrare descrie o tehnologie pentru crearea tezaurului domeniului obiect, care se bazează pe titlul de subiect pentru enciclopedia specializată. O astfel de tehnologie oferă o descriere de înaltă calitate a domeniului obiectului folosind termeni de încredere, permițând astfel construirea unei prime etape a tezaurului cu un angajament minim al experților în acest domeniu particular de cunoaștere. Tehnologia propusă conține, de asemenea, un algoritm de construire a tezaurului și o aplicație bazată pe web care implementează acest algoritm.
Introducere
Unul dintre cei mai importanți factori care asigură implementarea cu succes a proiectelor de cercetare de integrare este sprijinul științific și informațional eficient. În special, munca în comun cercetătorii de mai multe specialități (mai mult, nu întotdeauna înrudite) necesită o coordonare atentă a terminologiei utilizate, deoarece același concept poate fi desemnat în diferite domenii ale științei prin termeni diferiți, iar printr-un singur termen - concepte diferite.
O altă sarcină de susținere informațională a proiectelor este crearea unui card index integrat al descrierilor bibliografice ale documentelor (adică articole, cărți etc.) pe tema proiectului, întocmit prin combinarea resurselor cercetătorilor colaboratori, fiecare dintre aceștia având deja a acumulat un index de card pentru unul sau altul subiect (în prezent, astfel de indexuri de carduri sunt stocate, de regulă, pe suporturi electronice). Pentru a facilita căutarea în indexul cardurilor, este de dorit ca cuvintele cheie care caracterizează documentele să fie selectate, ori de câte ori este posibil, dintr-un singur dicționar. Pentru clasificarea automată a documentelor incluse în indexul cardurilor sau care pot fi introduse în acesta din bazele de date electronice
© Institutul de Tehnologii Computaționale, Filiala Siberiană a Academiei Ruse de Științe, 2007.
publicații științifice precum o bază de date de reviste de rezumate, „Conținut curent”, etc., pare oportună folosirea algoritmului de indexare a coordonatelor. Acest algoritm se bazează pe luarea în considerare a trăsăturilor de clasificare a termenilor (cuvinte și fraze) incluși în text care caracterizează un anumit domeniu.
Rezolvarea tuturor problemelor enumerate mai sus este imposibilă fără crearea unui dicționar de termeni din domeniul subiectului, iar în acest dicționar ar trebui stabilite legături între termeni și ar trebui efectuată clasificarea termenilor. Un astfel de dicționar se numește tezaur (vezi detalii în). Un tezaur (sau tezaur normativ) este un dicționar de referință care conține toate unitățile lexicale ale unui limbaj de regăsire a informațiilor - descriptori (împreună cu cuvintele cheie care în cadrul acestui sistem de regăsire a informațiilor sunt considerate sinonime ale acestor descriptori), iar descriptorii din dicționar trebuie sistematizati conform sensului, iar conexiunile semantice dintre ele sunt exprimate în mod explicit.
Cu toate acestea, compilarea unui tezaur „de la zero” poate necesita o contribuție semnificativă a forței de muncă din partea experților care trebuie să colecteze toți termenii care acoperă suficient domeniul subiectului, să convină asupra semnificațiilor acestora, să stabilească legături și să realizeze o clasificare. Astfel de dificultăți care apar în rezolvarea, deși o sarcină importantă, dar totuși auxiliară, pot afecta negativ perspectivele soluționării acesteia.
Am dezvoltat și implementat o tehnologie pentru crearea unui tezaur bazat pe indexul de subiecte al enciclopediilor de specialitate. Această tehnologie oferă o descriere înalt calificată a domeniului subiectului folosind termeni verificați în mod fiabil, permițând etapa inițială de construire a unui tezaur cu implicarea minimă a specialiștilor - experți în acest domeniu. O prezentare detaliată și o justificare a algoritmului sunt date în lucrare. Mai jos este scurta descriere algoritmul, precum și aplicația web care îl implementează.
1. Algoritm pentru crearea unui tezaur
Se propune utilizarea indexului de subiecte al unei enciclopedii specializate (sau mai multor enciclopedii) ca o listă de cuvinte cheie și expresii pentru tezaur. Alegerea unei anumite enciclopedii este făcută de un specialist în materie, iar această alegere depinde de obiectivele urmărite la crearea tezaurului. Deci, pentru a rezolva probleme complexe de mediu, este indicat să folosiți enciclopedii (sau, în lipsa acestora, dicționare enciclopedice) în fizică, chimie, geologie, biologie, medicină, matematică etc., apoi, cel puțin, ca o listă de bază de cuvinte cheie, care vor fi completate dacă este necesar.
Indexurile de subiecte ale majorității enciclopediilor sunt structurate într-un mod similar - conțin termeni care sunt numele articolelor enciclopediei, termeni ale căror definiții sunt date în articole, precum și cele mai importante rezultate menționate în articole.
Numele articolelor enciclopediei sunt luate ca descriptori (adică termeni care sunt numele claselor de concepte similare), iar cuvintele din indexul subiectelor găsite în
articole. Principalul avantaj al acestei metode este că nu trebuie să fii un expert într-un anumit domeniu pentru a stabili tipurile de relații dintre termeni - cunoștințele generale sunt suficiente pentru a înțelege textul enciclopediei - informații mai specifice necesare în procesul de conceptele de clasificare pot fi întotdeauna culese dintr-un articol specific...
Deoarece tezaurul creat este conceput să funcționeze folosind protocolul Z39.50, tipurile de legături sunt stabilite în conformitate cu recomandările schemei / l lies, care distinge următoarele tipuri:
BT - legătură cu un termen parental, adică cu un termen de înțeles mai larg;
NT este o legătură cu un termen copil, adică cu un termen cu un sens mai restrâns. Relația BT - NT este reciprocă;
USE este un link către termenul care este folosit în schimb;
UF - USE feedback reciproc;
RT este o legătură care definește un termen înrudit;
LE - relația dintre termeni echivalenti din punct de vedere lingvistic;
FE sunt termeni complet identici.
În plus, clasificarea descriptorilor este realizată în conformitate cu secțiunile din acest domeniu. Alegerea unui anumit clasificator, precum și alegerea unei enciclopedii, este efectuată de un expert, iar în cazul utilizării mai multor enciclopedii din diferite domenii, este posibil să se utilizeze mai multe clasificatoare specializate. Legăturile sub forma NT, RT, LE (FE) sunt stabilite între descriptori și secțiunile clasificatoare, în timp ce clasificarea ar trebui să utilizeze, dacă este posibil, secțiuni de cel mai scăzut nivel posibil.
După aceea, cuvintelor cheie asociate descriptorului prin relațiile BT, USE, RT, LE și FE li se atribuie același număr de clasificare ca și descriptorului. Totuși, acest lucru nu exclude o astfel de situație în care, dacă descriptorul este atribuit unei clase care nu este de cel mai jos nivel, atunci în timpul lucrărilor ulterioare a expertului, termenii asociați cu descriptorul prin relațiile BT și USE pot fi atribuiți clasei. de un nivel inferior. În acest caz, termenii specificați vor deveni ei înșiși descriptori.
În consecință, toți termenii incluși în indexul subiectelor sunt clasificați în conformitate cu secțiunile din acest domeniu.
2. Descrierea operațiunii aplicației web
Cu toate acestea, procesul de construire a unui tezaur în conformitate cu această metodologie implică o cantitate mare de muncă de rutină și, în plus, necesită participarea unei persoane cu abilități de programare. Prin urmare, pe lângă metodologie, a fost dezvoltată o aplicație web care are o interfață ușor de utilizat și suportă următoarele funcții:
1) traducerea automată a informațiilor din paginile digitizate ale indexului subiectului într-un tabel de bază de date;
2) evidenţierea descriptorilor în lista generală de termeni;
3) căutați termeni asociați cu un descriptor dat și stabiliți tipurile de legături în conformitate cu schema Zthes.
Este important de reținut că abilitățile de programare nu sunt necesare pentru a efectua toate operațiunile de mai sus.
Aplicația dezvoltată este universală, adică poate fi folosit pentru a crea tezauri de diferite domenii. În prezent, programatorul efectuează conversia programului din indexul de subiect al unei enciclopedii în indexul de subiect al alteia (și numai în această etapă, procesele de construire a tezaurilor din diferite domenii de subiect pot fi diferite), totuși, munca este în curs de completare a programului cu funcții care permit utilizatorului să efectueze această operațiune. neavând abilități de programare.
Aplicația funcționează după cum urmează. Paginile index digitalizate sunt procesate automat. Utilizatorul specifică locația fișierului text cu date, după care este citit rând cu rând și termenii înșiși sunt introduși în baza de date, precum și informații despre numerele paginilor enciclopediei în care se află (Fig. 1).
Descriptorii din lista generală de cuvinte cheie sunt selectați de către utilizator însuși, marcând termenii de căutare în lista afișată pe ecran. \ ¥ ob-appopio suportă și funcția de corectare a eventualelor erori (Fig. 2). Amintiți-vă că toți termenii găsiți în articolul de enciclopedie dedicat acestuia sunt considerați a fi asociați cu acest descriptor.
Pentru a facilita căutarea termenilor înrudiți, utilizatorului i se prezintă doar o listă de cuvinte cheie situate pe aceeași pagină cu descriptorul pe care l-a selectat (de fapt, pentru aceasta, am introdus în baza de date doar termeni și informații despre multe pagini) . Desigur, deoarece articolul poate să nu ocupe întreaga pagină în întregime, termenii inutile vor fi adăugați la listă. Utilizatorul, care realizează conexiuni,
Orez. 1. Introducerea fișierelor text cu termeni din indexul subiectului
№ Crearea dicționarului de descriptor - Microsoft Internet Explorer!
Fișier Editare Vizualizare Favorite Service Help
Q Înapoi „©” @ | í | & uR Căutare ^ Favorite -. v
Adresa; | ¡J§ http: ^ localhost / math_dict / Deskj-_Slovar / Descr / gen_ss.phtml; V ¡¿3 Legături de tranziție y>
fiBár JOQQ- © - I * 1] 0 l de: * - F
1 Abac | 1, 13 1111111
2 automat abelian | 1, 67 1111111
3 Obiect de grup abelian | 1, 1149 111 1 | |
4 Diferenţial abelian 11.13-15 I 2, 240 111111
5 Diferenţial abelian, bază | 1, 13 1111111
6 Diferenţial abelian, divizor | 1, 15 | | | | | 1 |
7 Abelian diferenţial normal | 1, 14 1111111
8 Diferenţial abelian, normalizat | 1, 14 1111111
9 Diferenţial abelian, perioadă polară | 1, 14 | | | | | | |
10 Diferenţial abelian, perioadă ciclică | 1, 14 1111111
11 Abelian idempotent 14, 941 1111111
12 integrală abeliană 11.15-17 1111111
13 Integrală abeliană, teorema lui Abel | 1, 17 1111111
14 integral abelian canonic | 1.16 ||||||
16 Integrală abeliană, matricea perioadei | 1,16 ||||||
15 Abelian integrală normală | 1, 16 |||||||
17 Integrală abeliană, perioadă polară | 1,16 ||||||| 1S integrală abeliană, perioadă ciclică | 1, 16 | | | | |
19 Potenţial abelian | 2, 239 1111111
20 Abelev a grup 11.17-20 1111111
21 Grup abelian complet descompunabil | 1,19 ||||||
22 Grup abelian divizibil | 1, 19 |||||||
23 Grup abelian finit generat | 1,18 1111111
24 Grup abelian, criteriul Kulikov | 1, 18 | | | | | |
25 Grup abelian, zero | 3.1082 1111111
26 Grup abelian, parte periodică | 1, 18 111 | |
http: // locdlhostymath_dict / Deskr_Slovar / Descr / goto, phtml? ss 1 + 4 + 1 + A + 1 + 3
j 5tartApache.bat
Eu Svoj.NET: PHP Edit
J Adobe Photoshop || w
^ Intranet local
EN Sch / m K 21: 0;
Orez. 2. Lista de cuvinte cheie și descriptori de evidențiere
Orez. 3. Alegerea termenilor conexe
Orez. 4. Stabilirea tipurilor de conexiuni.
va selecta doar o parte din cuvintele cheie din lista propusă, cu toate acestea, o astfel de automatizare reduce semnificativ cantitatea de muncă de rutină (Fig. 3).
Relația dintre descriptor și cuvânt cheie este specificată prin completarea formularului corespunzător (Fig. 4).
Concluzie
Eficiența acestui algoritm și a aplicației web a fost testată prin crearea unui tezaur al unui număr de secțiuni din domeniul „Matematică” („Ecuații diferențiale”, „Ecuații diferențiale parțiale”, „Analiză numerică”, „Mecanica fluidelor”, etc. .) pe baza indexului de subiecte „Enciclopedia Matematicii”. S-a constatat că pentru clasificarea termenilor și stabilirea legăturilor între aceștia este suficientă o calificare de licență (cu condiția ca în cazuri rare să fie implicat în consultații un expert cu diplomă științifică). Acest lucru demonstrează eficiența ridicată a algoritmului dezvoltat.
Bibliografie
Mihailov A.I., Cherny A.I., Gilyarevsky P.C. Fundamentele Informaticii. Moscova: Nauka, 1968.
Barakhnin V.B. Elaborarea tezaurului disciplinei „Matematică” // Mater, conf. „Calcul și tehnologiile informaționale în știință, tehnologie și educație”. Partea 1. Novosibirsk; Almaty; Ust-Kamenogorsk, 2003.S. 111-115.
Zthes: un profil Z39.50 pentru navigarea în tezaur
http://lcweb.loe.gov/z3950/agency/profiles/zthes-04.html
PROBĂ
Syn: model, specimen, exemplu, eșantion, standard, normă, măsurare, eșantion, standard, reprezentant tipic, șablon, șablon, prototip, desen, construcție, desen, model, gestalt, cadru
Tezaur al limbii ruse.
2012A se vedea, de asemenea, interpretările, sinonimele, semnificațiile cuvântului și care este EȘANUL în rusă în dicționare, enciclopedii și cărți de referință:
- PROBĂ
HAFDASA 1927 - Pistol automat argentinian calibrul 22. Era o armată... - PROBĂ în Ghidul esențial al armelor:
EXPERIMENTAL - copii unice ale oricărui design de arme de foc, nu sunt acceptate pentru serie ... - PROBĂ în Ghidul esențial al armelor:
MUSHKETA - pușcă capsulă americană din 1849-1855. Calibru 58 cu butoi. Lungime 1016... - PROBĂ în Ghidul esențial al armelor:
PUSCĂ - Pușcă capsulă americană 1849-1855 calibru 58. Lungime 838... - PROBĂ în Ghidul esențial al armelor:
70 - Pistol automat cehoslovac, calibrul 7, 65 ... - PROBĂ în Ghidul esențial al armelor:
63 - Mitralieră poloneză cu cincisprezece și douăzeci și cinci de focuri de calibru 9 mm. Lungime cu stoc 583 mm, fără stoc 330 mm. Greutate… - PROBĂ în Ghidul esențial al armelor:
61 - Mitralieră cehoslovacă cu zece și douăzeci de focuri calibrul 7, 65 mm. Lungime cu stoc 513 mm, fără stoc 269 mm. ... - PROBĂ în Ghidul esențial al armelor:
58 P - Mitralieră cehoslovacă de treizeci de focuri de calibru 7,62 mm. Lungime 820 mm. Greutate 3140... - PROBĂ în Ghidul esențial al armelor:
58 V - Mitralieră cehoslovacă cu treizeci de focuri de calibru 7,62 mm. Lungime cu stoc 820 mm, fără stoc 635 mm. Greutate… - PROBĂ în Ghidul esențial al armelor:
52 —1. Vezi CHZET-513. 2. Carabină automată cu autoîncărcare cehoslovacă cu zece lovituri de 7,62 mm. Lungime 1003 mm. Greutate 4100... - PROBĂ în Ghidul esențial al armelor:
50 - Pistol automat cehoslovac, calibrul 7, 62 mm. Copie redusă a CHZET-513. A fost în serviciu... - PROBĂ în Ghidul esențial al armelor:
25 - 1. Mitralieră cehoslovacă de douăzeci și patru și patruzeci de focuri de calibru 9 mm. Lungime cu stoc 686 mm, fără stoc 445 mm. Greutate… - PROBĂ în Ghidul esențial al armelor:
23 - Mitralieră cehoslovacă de douăzeci și patru și patruzeci de focuri de calibru 9 mm. Lungime 686 mm. Greutate 3270... - PROBĂ în Ghidul esențial al armelor:
16/33 - Carabină cehoslovacă cu cinci lovituri de reviste de 7, 92 mm. Lungime fara baioneta 995 mm, cu baioneta 1305 mm. Greutate… - PROBĂ
INDUSTRIAL - vezi MODEL INDUSTRIAL... - PROBĂ în Dicționarul de termeni economici:
- o copie unică reprezentativă a produsului utilizat pentru publicitate, la expoziții, în scopul familiarizării, expunerii la potențiale... - PROBĂ v Dicționar enciclopedic:
, -ztsa, m. 1. Produs orientativ sau de probă; eșantion (în 2 valori). 06 probe de sol. Mostre de minerale. Mostre de produse. Industrial despre. (nou, ... - PROBĂ în Marele Dicționar Enciclopedic Rus:
EȘANȚĂ INDUSTRIALĂ, vezi Industrial... - PROBĂ în Paradigma completă accentuată de Zaliznyak:
eșantion "c, mostre", eșantion ", eșantion" c, eșantion ", eșantion" m, eșantion "c, mostre", eșantion "m, mostre" mi, eșantion ", ... - PROBĂ în Dicționarul explicativ și enciclopedic popular al limbii ruse:
-zts „a, m. 1) (de obicei, ce) O copie indicativă sau de probă a unui produs, material; parte dintr-o substanță, produs care dă o idee... - PROBĂ în Dicționarul pentru rezolvarea și compilarea cuvintelor scanate:
… pentru … - PROBĂ în Tezaurul Vocabularului de afaceri rusesc:
- PROBĂ în Dicționarul de Sinonime al lui Abramov:
probă, prototip, prototip, tip, prototip, ideal, model, original, exemplu; model. Prot. ... Vezi ideal, exemplu,... - PROBĂ în dicționarul de Sinonime al limbii ruse:
Sin: model, copie, exemplu, eșantion, standard, normă, măsurare, eșantion, standard, reprezentant tipic, șablon, șablon, prototip, desen, construcție, desen, model, ... - PROBĂ în Noul Dicționar explicativ al limbii ruse de Efremova:
m. 1) Copie aproximativă, orientativă sau de probă a unui l. produs, material etc. 2) a) Indicativ exemplu de smth.... (ce calități, comportament,...
3.1. Conceptul de tezaur
Tezaur (din greaca θήσαϋροξ - comoara, rezerva) sau un dictionar ideografic (din greaca idee - concept, reprezentare, idee si grapho - scriu, descriu) - in lingvistica moderna: 1) un tip special de dictionare de general sau special vocabular, în care relații semantice între elementele lexicale; 2) un dicționar pentru căutarea unui cuvânt prin legătura sa semantică cu alte cuvinte; 3) un anumit mod de organizare (poziționare) a cuvintelor în dicționar; 4) un mod de organizare a compoziției lexicale, care vă permite să „modelezi lumea” economic.
În primul, primordial, sensul - depozit, comoară, termenul tezaur a fost folosit de L.V. Shcherba în articolul „Experiența în lexicografia generală” (a treia opoziție: tezaurul este un dicționar obișnuit (explicativ sau tradus)). Omul de știință scrie: „Când se spune tezaur, în zilele noastre se referă cel mai adesea la „Thesaurus linguae latinae”, o întreprindere a cinci academii germane, începută în 1900 și încă adusă cu omisiuni doar la litera M. O trăsătură caracteristică acest tip de dicționare o reprezintă în faptul că ele conţin toate cuvintele decisiv găsite în această limbă cel puțin o dată, și că sub fiecare cuvânt sunt absolut toate citatele din textele disponibile în limba dată. Opoziția de mai sus - tezaur - un dicționar obișnuit (explicativ sau de traducere) - se bazează pe opoziția „material lingvistic” și „sistem lingvistic” - conceptele pe care am încercat să le fundamentez în articolul meu „Despre triple aspect al fenomenelor lingvistice și pe experiment în lingvistică”.
A doua semnificație a acestui termen este asociată cu cunoscutul dicționar-tezaur „Tezaur cuvinte englezeștiși expresiile „P.M. Roget (Tezaurul cuvintelor și frazelor englezești al lui Roget, 1852) și continuarea lui, dicționarul lui OV Baranov.
În această interpretare, termenul tezaur denotă un anumit mod de organizare, aranjarea compoziției lexicale în dicționar (vezi cel de-al treilea sens al termenului).
Al patrulea înțeles al termenului tezaur este asociat cu recunoașterea generală a unui astfel de mod de organizare a compoziției lexicale, care face posibilă „modelarea lumii” economic. Din acest punct de vedere, un dicționar-tezaur este „o ordonare sistematică a vocabularului oricărui domeniu științific sau tehnic, iar în cel mai mult vedere generala- vocabularul literar general și, în plus, întregul vocabular al unei anumite limbi.”
Potrivit lui Yu.N. Karaulov, un tezaur de limbă generală, fixând în structura și relațiile titlurilor, secțiunilor, zonelor, zonelor sale posibilități largi de conectare non-verbală a ideilor, asigură luarea în considerare a valorilor umane.
UN. Baranov și D.O. Dobrovolsky în prefața „De la editori” la „Dicționarul-tezaur al idiomurilor ruse moderne” dă tezaurului următoarea definiție - un tip special de dicționar care diferă de altele (în special, explicativ, bilingv etc.) de organizare a materialului lingvistic. În tezaur, unitățile de limbă nu sunt prezentate în ordine alfabetică, ca într-un dicționar obișnuit, ci sunt grupate în funcție de semnificația lor.
L.P. Krysin numește tezaurul (dicționarul ideologic) un dicționar explicativ de un tip special, un dicționar „dimpotrivă”. „Dacă în dicționarul explicativ, omul de știință scrie, „intrarea” la intrarea din dicționar este cuvântul, iar conținutul intrării din dicționar este interpretarea sensului acestui cuvânt, atunci în dicționarul ideografic „intrarea” este sensul, ideea (de unde și denumirea acestui tip de dicționare - ideografic), iar conținutul unei intrări de dicționar este o listă de cuvinte care exprimă sensul dat. Și dacă dicționarul explicativ este un instrument indispensabil în înțelegerea textului, atunci dicționarul ideografic poate fi folosit la generarea textului: de foarte multe ori o persoană dorește să exprime un anumit gând, dar nu poate găsi cuvinte potrivite pentru aceasta; un dicționar ideografic facilitează aceste căutări. Există două tipuri principale de tezauri:
tezaur lingvistic - un dicționar care conține o listă de cuvinte din limbaj natural selectate ca urmare a unei analize semnificative a textelor și sistematizate în conformitate cu sistemul de clasificare adoptat;
tezaurul statistic este un dicționar de regăsire a informațiilor care conține o listă de cuvinte selectate ca rezultat al analizei statistice a textelor pe o anumită temă și grupate în intrări de dicționar pe baza frecvenței de apariție comună a acestor cuvinte în aceleași texte.
Tezaurile de regăsire a informațiilor (IPT) facilitează căutarea informațiilor în timpul procesării sale automate. IPT dezvăluie la maximum relațiile semantice dintre unitățile lexicale. După cum se precizează în Standardul de stat pentru IPT, „un tezaur monolingv de regăsire a informațiilor este un dicționar controlat și schimbător de unități lexicale bazat pe vocabularul unei limbi naturale, afișând relații semantice între unitățile lexicale și destinat procesării și regăsării informațiilor”.
Unitatea de bază a IPT sunt termenii descriptori. Partea alfabetică, lexico-semantică a IPT este o colecție de intrări de descriptor.
Dicționarele descriptive sunt destinate unei descriere completă a vocabularului unei anumite zone și pentru fixarea tuturor utilizărilor acolo; înregistrează toate cazurile relevante disponibile. Exemplu tipic Dicționarul descriptiv este „Dicționarul explicativ al Marii Limbi Ruse Vie” de V.I. Dahl (prima ediție în patru volume a fost publicată în 1863-1866). Scopul creatorului său nu a fost acela de a standardiza limba, ci de a descrie pe deplin întreaga varietate a limbajului rusesc, inclusiv formele sale dialectale de limba vernaculară.
Fiecare intrare din dicționar de descriptor începe cu un descriptor, în care sinonimele acestui descriptor, precum și alte unități lexicale asociate cu descriptorul principal, relații generice sau asociative, sunt date mai jos în cadrul articolului GOST.
Astfel, tezaurile, în special în format electronic, sunt unul dintre cele mai eficiente instrumente pentru descrierea unor domenii specifice.
Tezaurul pur este rar. În tezaurile reale, ideea inițială este simplificată sau se adaugă informații suplimentare care sunt potențial necesare pentru utilizator. Cele mai faimoase astăzi sunt „Dicționarul semantic rus” de Yu.N. Karaulova, „Dicționar al numelui identic” N.Yu. Shvedova, „Dicționar tematic al limbii ruse” L.G. Smekhova și alții.
Rezumat. Tezaurul termenilor L.V. Shcherba l-a folosit în raport cu dicționarul, care a consemnat, ori de câte ori era posibil, toate contextele în care apare cuvântul dat. O trăsătură caracteristică a tezaurilor este că ele conțin toate cuvintele care au apărut într-o anumită limbă cel puțin o dată, iar sub fiecare cuvânt sunt toate citatele din textele disponibile în limba dată. Conținutul dicționarului tezaurului este material lingvistic, iar conținutul unui dicționar obișnuit este material lingvistic și sistem lingvistic (termenii lui L.V. Shcherba).
Această caracteristică completate de legături încrucișate de tot felul – mai adesea paradigmatice (sinonime sau antonimice), care indică comunitatea sau opoziția semnificațiilor. În plus, diverși conf. univ. link-uri (adică sintagma. link-uri).
Astfel, sarcina tezaurului (dicționarului ideologic) este de a da o idee despre organizarea semantică a unei anumite felii de material lingvistic, arătând principalele câmpuri semantice, structura lor internă și conexiunile externe. Tezaurul este o demonstrație vizuală a naturii sistemice a limbii, permițându-vă să vedeți numeroasele tipuri de relații care leagă unități lingvistice individuale și grupuri de unități.
3.2. Istoria prezentării cunoștințelor conceptuale despre lume sub forma unui tezaur
Nevoia de a aranja cuvintele după asemănare, contiguitate, analogie a semnificațiilor lor a fost simțită de-a lungul istoriei observabile a gândirii umane.
Pentru a urmări originea ideii de reprezentare a cunoștințelor conceptuale despre lume sub forma unui tezaur, vom fi ajutați prin referirea la istoria compilării tezaurilor (dicționare ideologice).
Așadar, în zorii civilizației, când oamenii își puteau exprima gândurile în scris doar cu ajutorul ideogramelor și simbolurilor, singurul dicționar posibil era probabil cel în care cuvintele erau aranjate în grupuri tematice. Era pur și simplu dificil pentru un lexicograf de atunci să găsească un alt criteriu de clasificare a cuvintelor, cu excepția relațiilor existente în realitatea însăși.
Din păcate, nu avem nicio dovadă că popoarele care au folosit grafia ideografică aveau astfel de dicționare la dispoziție. Printre cele mai vechi încercări de clasificare ideografică cunoscute nouă se numește Attikai Lexeis al gramaticii grecești, director al Bibliotecii din Alexandria Aristofan din Bizanț (mort în 180 î.Hr.).
În secolul al II-lea. n. e. apare o lucrare majoră „Onomasticon”, întocmită pe materialul limbii grecești de către lexicograful și sofistul Julius Pollux (numele adevărat Polidevkus), originar din orașul egiptean Navcratis. Y. Pollux a scris mai multe lucrări, dar doar „Onomasticon” ne-a supraviețuit (Pollux Y. Onomasticon. M., 1956).
Onomasticon este format din 10 cărți. Cărțile sunt în esență tratate separate și conțin cele mai importante cuvinte legate de un anumit subiect. Astfel, prima carte vorbește despre zei și regi; în al doilea - despre oameni, viața lor și structura fiziologică; în a treia - despre rudenie și relații civile etc. Cuvintele din dicționar sunt însoțite de scurte explicații. În timpurile moderne, dicționarul a fost publicat pentru prima dată în 1502 la Veneția.
Între secolele II și III n. e. este publicat minunatul dicționar sanscrit „Amarakosha” (Amarakosha. Paris, 1839). Autorul său este poetul, gramatica și lexicograful indian antic Amara Sina, care a fost numit „una dintre cele nouă perle care împodobesc tronul Vikramaditya”. Amarakosha, tradus în rusă, înseamnă vistieria Amarei. Dicționarul conține 10 mii de cuvinte. Pentru o mai bună memorare a interpretării semnificațiilor cuvintelor, intrările de dicționar sunt construite sub formă de versuri. Tot materialul dicționarului este împărțit în 3 cărți. Fiecare carte cuprinde mai multe capitole, iar capitolul la rândul său, dacă este necesar, este împărțit într-un număr de secțiuni. Prima carte este dedicată cerului, zeilor și tot ceea ce are legătură directă cu ei. A doua carte conține cuvinte legate de pământ, așezări, plante, animale și om (în primul rând, omul este considerat ca ființă vie, apoi ca ființă socială; întreaga structură de castă a societății moderne apare în fața ochilor noștri; preoții, ca Confidenții lui Dumnezeu, sunt foarte sus, iar dedesubt sunt militarii și regii, chiar mai jos sunt proprietarii de pământ, iar în partea de jos sunt artizani, jonglerii, servitorii etc.). A treia carte este de fapt lingvistică, așa cum reiese din titlurile celor șase capitole ale sale.
Dicționarul a devenit cunoscut savanților europeni abia la sfârșitul secolului al XVIII-lea, când în 1798 a fost publicată prima sa parte la Roma. A fost publicată integral cu o traducere în engleză în 1808 de către sanscritologul englez G.T. Colebrooke. În 1839, traducerea sa în franceză de A.L. Delonshan (A.L. Deslongchamps). Dezvoltarea ulterioară a ideii unei clasificări semantice a vocabularului este asociată cu problema așa-numitei limbi mondiale.
Rezumat. Aceasta, în schița cea mai generală, este prima etapă în dezvoltarea tradiției clasificării ideografice a vocabularului. Această etapă poate fi numită preistoria dicționarelor ideografice. Acum este recomandabil să apelăm la clasificarea modernă a dicționarelor de tezaur.
Este ușor de observat cât de diferite sunt lucrările descrise față de dicționarele alfabetice. Dacă în dicționarele alfabetice prezentarea cuvintelor este reglementată de un instrument condiționat și extrem de neutru precum alfabetul, atunci când se construiește un dicționar ideografic crucial dobândește viziunea asupra lumii a lexicografului însuși.
3.3. Principii de clasificare a dicționarelor de tezaur
După cum sa arătat deja mai sus, problema elaborării unei clasificări a tezaurilor nu este nouă și de câteva decenii a atras atenția unui număr de lingviști interni și străini (K. Marello, V.V. Morkovkin, L.P. Stupin, V.V.Dubichinsky etc.). Rezultatul cercetărilor în acest domeniu a fost crearea unor clasificări alternative ale acestor lucrări lexicografice. Una dintre cele mai recente clasificări se bazează pe următoarele criterii: a) tipul de legături semantice dintre unitățile de vocabular; 2) volumul vocabularului; 3) vocabular generalizat; 4) dezvoltarea sensului jetoanelor; 5) calificarea gramaticală și stilistică a lexemelor; 6) demonstrarea funcționării lexemelor; 7) numărul de limbi reprezentate; 8) tipul de mijloace semiotice folosite pentru semantizarea lexemelor. Clasificarea numită se bazează pe clasificările create anterior de O.M. Karpova și I. Burkhanov (Burchanov I. On the Ideographic Description of Stylistically and Pragmatically Relevant Aspects of Lexical Meanings. Londra, 1996); terminologia folosită în clasificare este introdusă în aparatul lexicografic
V.V. Morkovkin, Yu.N. Karaulov, K. Marello. Criteriile de clasificare au fost formulate de O.M. Karpova. În același timp, K. Marello distinge trei tipuri de tezauri:
cumulative, care sunt grupări de cuvinte fără a le defini semnificațiile;
definitivă, interpretând fiecare unitate lexicală de grupare de cuvinte;
tezaure bilingve și multilingve pentru călători (Marello C. Thesaurus // W.D.D. 1990. V. 2. P. 1083).
Tezaurile cumulate nu numai că oferă o oportunitate de a găsi un cuvânt mai înțeles, mai precis, mai corect din punct de vedere stilistic într-o situație de a fi într-un anumit câmp semantic, dar devin și baza formării băncilor de date informatice tematice.
Tezaurile definitive pot include, alături de definirea sensului, informații etimologice și citări din opere literare, care arată orientarea directă enciclopedică a acestui tip de tezaure. În plus, dicționarele de acest tip introduc utilizatorul în sistemul necesar de concepte, explică esența, asemănările și diferențele dintre concepte, conexiunile lor paradigmatice și sintagmatice, oferă uneori informații despre pronunție, gramatică, formarea cuvintelor și alte posibilități de lexical. unități care denotă aceste concepte.
Tezaurile bilingve și multilingve pentru călători sunt de obicei create în funcție de secțiuni tematice: numere, alimente, transport, hotel etc. cu traducerea echivalentelor a două sau mai multe limbi.
Pentru cea mai completă afișare a tipurilor de dicționare de tezaur existente, este creată o clasificare pe mai multe niveluri. În primul rând, în funcție de tipul de conexiuni semantice dintre unitățile vocabularului, tezaurile sunt împărțite în trei clase mari:
1. Tezaur asociativ (terminologia lui Yu.N. Karaulov
2. Un tezaur similar (terminologia lui V.V. Morkovkin
3. Tezaur ideologic (ideologic) (terminologia lui L.V. Shcherba, V.V. Morkovkin. Cele trei tipuri de tezaur menționate mai sus reflectă următoarele tipuri conexiuni semantice ale lexemelor, respectiv:
1. Relaţii semantico-sintactice, pe baza cărora
cuvintele sunt combinate în grupuri sau perechi, predeterminate în originea și existența lor prin duble legături: semantică și sintactică. Legăturile semantice ale cuvintelor se stabilesc în principal între verbe și adjective care îndeplinesc o funcție predicativă într-o propoziție și substantive, de exemplu:
a) între acțiune și orga (instrumentul) cu ajutorul căruia se execută: apuca - mână, see - ochi, înot - barcă etc.;
b) între verbele de acțiune, care necesită un subiect, și subiect: lătrat - un câine, nech - un cal etc.; c) între verbe și un anumit adaos gramatical, pe care primii le cer: toacă lemne, mănâncă mâncare etc.
Prin urmare, un tezaur asociativ este un dicționar-tezaur care organizează unitățile lexicale pe baza legăturilor semantice și sintactice existente între ele și aranjează grupurile în conformitate cu forma grafică a centrelor de cuvinte.
2. Conexiuni lexicale si semantice. Unificarea în grupuri cu acest tip de conexiune are loc în funcție de atributul principal pentru cuvinte - sensul lexical. Aceasta ține cont și de conexiunile lexico-gramaticale, sub forma cărora se realizează semnificațiile individuale ale cuvintelor.
Astfel, un tezaur analog este o carte de referință lexicografică, a cărei unitate de bază a macrostructurii este grupul lexico-semantic; grupurile sunt sistematizate în ordinea alfabetică a dominantelor semantice.
3. Legături de subiecte sau tematice, în care combinarea cuvintelor într-un singur grup are loc datorită asemănării sau comunității funcțiilor obiectelor și proceselor indicate prin cuvinte: obiecte
articole de uz casnic, părți ale corpului, tipuri de îmbrăcăminte, clădiri etc.
Astfel, un tezaur ideografic este o lucrare lexicografică care reprezintă unități lexicale în cadrul grupurilor de subiecte (tematice) și le organizează într-o structură ierarhică menită să reprezinte cunoștințele conceptualizate despre lume.
În cadrul aceluiași criteriu, efectuăm o nouă subdiviziune de tipuri. Deci, tezaurul ideografic este reprezentat de următoarele 4 tipuri:
Un tezaur ideografic în sine.
Dicționar de subiecte.
Dicționar sistematic.
Dicţionar tematic-sistematic
Tezaurul ideografic însuși este un tip special de vocabular ideografic, a cărui macrostructură este organizată conform unei hărți sinoptice a priori suprapuse compoziției lexicale a limbii. Spre deosebire de alte tipuri de vocabular ideografic, tezaurul ideografic în sine se caracterizează printr-o structură de clasificare logică și strict ordonată bazată pe taxonomie științifică, chiar dacă vocabularul general este supus descrierii lexicografice (New Webster „Thesaurus. Landoll, 1991).
Un dicționar tematic este un tip special de tezaur ideografic, a cărui unitate principală a macrostructurii este grup tematic, inclusiv lexemele, combinate pe baza clasificării denotațiilor (referentelor) acestora și considerate din punct de vedere al relevanței lor pentru o anumită temă.
Un dicționar sistematic este un tip special de tezaur ideografic, a cărui structură de clasificare este menită să reprezinte relațiile semantice reale care există între unitățile lexicale ale limbii. În nucleul său, structura de clasificare reprezintă clasificarea lexico-gramaticală a vocabularului, cu alte cuvinte, structura sa paradigmatică, descrisă în termeni de subordonare și compunere.
Un dicționar tematic-sistematic este un tip special de dicționar ideografic, care este o combinație între un dicționar tematic și sistematic.
Rezumat. Clasificarea considerată a tezaurilor lingvistice include următoarele tipuri de dicționare: tezaur analog (terminologia lui VV Morkovkin); tezaur ideografic (ideologic) (terminologia lui L.V.Scherba și V.V. Morkovkin); conf. univ. tezaur (terminologie de Yu.N. Karaulov). Pop va fi prezentat în continuare. tezaurele și trăsăturile lor sunt dezvăluite.
3.4. Tezauri populare și caracteristicile lor
Cel mai faimos dintre dicționarele de tezaur disponibile, căruia termenul însuși își datorează existența, a fost creat pe baza în limba engleză; este un tezaur retipărit constant de P.M. Tezaurul de cuvinte și expresii engleze al lui Roger Roget (1852).
Este important de menționat că autorul Thesaurus of English Words and Expressions a folosit pe deplin experiența sa din acel moment. „Principiul pe care l-am urmat atunci când clasificam cuvintele”, scrie P.M. Roger este același care este folosit pentru a clasifica indivizii în diverse domenii ale istoriei naturale. Prin urmare, secțiunile evidențiate de mine corespund familiilor naturale de botanică și zoologie, iar rândurile de cuvinte sunt cimentate de aceleași relații care unesc șirurile naturale de plante și animale.”
P.M. Roger credea că o clasificare convingătoare a cuvintelor în funcție de semnificațiile lor este imposibilă până când obiectele realității numite aceste cuvinte sunt studiate și organizate corespunzător. Prin urmare, își începe munca prin împărțirea câmpului conceptual al limbii engleze în patru clasa mare: relații abstracte, spațiu, materie și spirit (minte, voință, sentimente). Aceste clase sunt subdivizate în continuare într-un număr de genuri, care, la rândul lor, sunt subdivizate într-un anumit număr de specii.
Printre lipsurile dicționarului ideografic al lui P.M. Oamenii de știință Roger atribuie următoarele: 1) nomenclatura nu tocmai convingătoare a claselor conceptuale de bază; 2) consistența abstractă prevalează asupra conexiunilor naturale ale cuvintelor; 3) inconvenientul relativ de utilizare (în mare măsură, acest neajuns este corectat în edițiile ulterioare).
În lexicografia rusă modernă există mai multe dicționare care ar trebui clasificate ca dicționare tezaur (dicționare ideologice). Acesta, de exemplu, a fost creat sub conducerea lui Yu.N. Karaulov „Dicționar semantic rus”, „Dicționar semantic rus”, editat de N.Yu. Shvedova, „Dicționar tematic al limbii ruse” L.G. Sayakhova, D.M. Khasanova și V.V. Morkovkina, „Dicționar de grupuri lexico-semantice de verbe rusești”, ed. E.V. Kuznetsova, „Dicționar ideologic al limbii ruse” de O.S. Baranov, „Conceptul lumii interioare a omului în limba rusă” V.I. Ubiyko, un dicționar educațional cuprinzător „Baza lexicală a limbii ruse” sub îndrumarea lui V.V. Morkovkin.
Să facem cunoștință cu unele dintre ele.
Dicționar-tezaur al idiomurilor rusești moderne „editat de A.N. Baranova și D.O. Dobrovolsky cuprinde patru părți principale: 1) rezumat; 2) o legendă; 3) corpul principal al Dicționarului tezaur; 4) indicatoare. Scopul Sinopsisului este de a oferi o imagine de ansamblu asupra structurii Corpusului Principal al Tezaurului. Listează toți taxonii cu subtaxoni și referințele paradigmatice corespunzătoare. Corpul principal al dicționarului tezaurului este o colecție de intrări de dicționar combinate în grupuri (taxa) și subgrupuri (subtaxoni) în conformitate cu semnificația expresiilor descrise în acestea. Fiecare articol conține o expresie și exemple de utilizare a acestuia în limba rusă modernă. Sinopsis, Legendă, Indicatori sunt părți de serviciu ale dicționarului-tezaur menționat mai sus, care oferă utilizatorului capacitatea de a lucra rapid și eficient. Legenda este folosită în cazurile în care nu sunt necesare exemple de utilizare a idiomurilor, deoarece reproduce toate informațiile cu excepția exemplelor. De fapt, acesta este vocabularul Dicționarului. Unitățile vocabularului sunt leme. Lema în acest caz este un idiom în forma sa originală (dicționar) și include, ori de câte ori este posibil, toate variantele sale esențiale. De exemplu, expresia de a sta nemișcat face parte din lema de a marca timpul, de a sta pe loc și de a aluneca pe loc.
Dicționarul conține două indicatoare. La finalul cărții există un articol „Conceptul teoretic al Dicționarului-tezaur al ideomaticii ruse moderne”, care analizează în detaliu trăsăturile științifice ale acestui proiect.
„Dicționar semantic rus”, creat sub îndrumarea lui Yu.N. Karaulova include 10 mii de cuvinte rusești, care sunt împărțite în 1600 de grupuri conceptuale. Selecția grupurilor se bazează pe repetarea elementelor de interpretare a cuvintelor în dicționare explicative: de exemplu, „acțiune”, „proprietate”, „instrument” etc.
„Dicționar semantic rus”, creat sub conducerea academicianului N.Yu. Shvedova, se bazează pe principii oarecum diferite tipice pentru compilarea atât a dicționarelor ideografice, cât și a celor explicative. În primul rând, toate cuvintele limbii sunt împărțite aici în patru clase: 1) unități indicatoare (pronume), 2) denumire (cuvinte semnificative), 3) conexiuni efective (conjuncții, prepoziții, verbe de legătură), 4) clasificare (cuvinte modale, particule, interjecții). În al doilea rând, în cadrul fiecărei clase, toate cuvintele sunt împărțite în părți de vorbire. În al treilea rând, în cadrul fiecărei părți de vorbire, seturile și submulțimile sunt identificate pe baza proximității tematice sau, dimpotrivă, a opoziției semnificațiilor cuvintelor.
DUDEN este o carte cu imagini (desene) pe partea stângă (după diferite programe) cu detalii numerotate (până la cele mai mici). În partea dreaptă, această listă numerotată este însoțită de titluri (chiar și în două limbi). De exemplu, o pagină întreagă conține echipamente feroviare, gări, șine. În dreapta sunt numele de săgeți, semafore, cârje etc.
„Dicționar tematic al limbii ruse” L.G. Sayakhova, D.M. Khasanova și V.V. Morkovkina conține 25 de mii de unități lexicale, grupate în trei clase mari: „Omul”, „Societatea”, „Natura”, care se ramifică treptat în subclase mai mici. De exemplu, în clasa „Uman” subclasele „Corpul și organismul uman”, „Viața umană”, „ Aspect, aspect uman "," Aspectul emoțional al unei persoane ", etc. Fiecare dintre subclase, la rândul său, este împărțită în unele chiar mai particulare:" Lumea emoțională a unei persoane "-" Proprietățile mentale ale unei persoane "-" Temperament "," Caracter "-" Trăsături generale de caracter " etc. Semnificația și utilizarea cuvintelor aparținând fiecărei clase sunt ilustrate prin cele mai comune expresii. De exemplu, cuvântul „râs”, care se află în subgrupul „expresie a sentimentelor, emoțiilor” din clasa „Persoană”, este însoțit de indicarea unor astfel de combinații cu acest cuvânt, cum ar fi râsul vesel, râsul vesel, râsul copilului, izbucnirea. în râs etc.
Rezumat. Unul dintre cele mai eficiente instrumente pentru descrierea disciplinelor individuale, în special în format electronic, sunt tezaurile.
Termenul tezaur a fost mult timp folosit pe scară largă în lingvistică pentru a desemna un tip special de dicționare, reflectând într-o măsură sau alta „imaginea lumii”, „modelul lingvistic al lumii” (după Yu.N. Karaulov). Tezaurul ca „trezorerie” a crescut în volumul său semantic și a căpătat un nou sens. Au început să numească un dicționar care nu numai că absoarbe toată bogăția lexicală a limbii, dar le organizează într-un anumit mod logico-sistemic. În dicționarul tezaurului, cuvintele sunt reunite în grupuri, iar această combinație are loc pe baza capacității unui cuvânt de a transmite un anumit concept.
Dicționarul tezaur a fost întotdeauna considerat în lingvistică ca un fel de sistem universal care asigură stocarea cunoștințelor colective (pentru o anumită societate) despre lume în formă verbală. Spre deosebire de alte dicționare, tezaurul-dicționar stochează aceste cunoștințe într-o formă structurată care reflectă ideile noastre despre „structura lumii”.
Cele mai cunoscute și populare tezaure în prezent sunt Tezaurul Roger englez, Dicționarul ideologic al limbii ruse de O.V. Baranova, Dicţionar semantic rus Yu.N. Karaulova, Dicționarul semantic rus al academicianului N.Yu. Shvedova, DUDEN, Dicționar tematic al limbii ruse L.G. Sayakhova, D.M. Khasanova și V.V. Morkovkin.