Mysql
 sql >> Database >  >> RDS >> Mysql

Spiegazione Wordnet SQL

WordNet è un fantastico database di parole. L'ho ricercato io stesso. Elencherò i miei risultati di seguito e spero che ti aiuti a capire meglio le tabelle.

Il tavolo Synset La tabella synsets è una delle tabelle più importanti del database. È responsabile dell'alloggiamento di tutte le definizioni all'interno di WordNet. Ogni riga nella tabella synset ha un synsetid, una definizione, un pos (parti del campo vocale) e un lexdomainid (che si collega alla tabella lexdomain). Ci sono 117373 synset nel database di WordNet.

La tabella delle parole WordNet ha anche una tabella "words", che ha solo due campi:un wordid e un "lemma". La tabella delle parole è responsabile dell'alloggiamento di tutti i lemmi (parole di base) all'interno del database di Wordnet. Ci sono 146625 voci in questa tabella

Allora... come sono collegate queste due tabelle? La risposta? La tavola dei sensi!

Il tavolo dei sensi La tabella dei sensi è responsabile del collegamento tra le parole (nella tabella delle parole), con le definizioni (nella tabella del synset). Le voci nella tabella dei sensi sono indicate come "coppie senso-parola" - perché ogni abbinamento di un wordid con un synset è un significato completo di una parola - un "senso della parola".
Ci sono un totale di 206.354 significati delle parole nel database di WordNet.

La tabella Lexdomains La tabella Lexdomains è referenziata dalla tabella dei sensi e viene utilizzata per definire a quale dominio lessicale appartiene una coppia senso-parola. Ci sono 45 domini lessicali nella tabella lexdomains. La tabella lexdomain, quindi, è il modo in cui WordNet "etichetta" una coppia senso-parola. Tuttavia, è piuttosto limitato, perché una coppia senso-parola può appartenere solo a UN dominio lessicale.

I 45 domini lessicali includono:

Aggettivi: tutto, impertinente

Avverbi tutti

Nomi Cime, atto, animale, artefatto, attributo,corpo, cognizione, comunicazione, evento, sensazione, cibo, gruppo, posizione,motivo,oggetto, persona, fenomeno, pianta, possesso, processo, quantità,linkdef, forma, stato, sostanza, tempo,

Verbi corpo, cambiamento, cognizione, comunicazione, competizione, consumo, contatto, creazione, emozione, movimento, percezione, possesso, sociale, statico, meteo, ppl

La tabella casedwords Alcune parole all'interno della tabella delle parole hanno naturalmente la prima lettera maiuscola, ad esempio:"A-team". Poiché la tabella delle parole memorizza tutte le parole in minuscolo, WordNet utilizza questa tabella per specificare la versione maiuscola della parola. Ci sono 40313 voci in questa tabella.

Ci sono molte altre tabelle nel DB WordNet, una volta che le avrò ricercate, posterò di nuovo.

Trovare i tuoi sinonimi Per rispondere alla tua domanda sui sinonimi, devi fare quanto segue.

Diciamo che vuoi trovare i sinonimi della parola "Carry". Per fare ciò, dovresti prima cercare nella tabella delle parole un lemma che corrisponda alla parola "carry". Questo produrrebbe l'id parola 21253. Dovresti quindi cercare nella tabella dei sensi per trovare tutte le coppie senso-parola per la parola carry. Questo produce 41 risultati:ogni risultato elenca il wordid 21253 e un senseid (che è l'indice della coppia senso-parola) e un synsetid.

Ora, dovresti quindi interrogare la tabella synset per ciascuno dei synsetid restituiti in modo da poter accedere al campo di definizione associato nella tabella synset.

Infine, per trovare i sinonimi per ciascuno dei synset elencati, devi semplicemente cercare nella tabella dei sensi altre coppie di senso delle parole che hanno condiviso lo stesso synset.

Esempio:una delle 41 coppie di senso delle parole per la parola "portare" è elencata di seguito:Se cerchiamo la definizione per questo synsetid 202083512, troverai "trasmetti o servi come mezzo per la trasmissione"

Per trovare tutti i sinonimi di questa definizione, dovresti quindi cercare nella tabella dei sensi lo stesso synsetid 202083512. Questo produce i sinonimi:canale, condotta, trasmettere, impartire e trasmettere (nota:dovrai unire a sinistra la tabella delle parole per ottenere i lemmi attuali)

Spero che questo ti aiuti a demistificare WordNet per te.. Trovo che sia piuttosto interessante...