Guida a GattoWeb

glossario

stampa
Iperlemmi


nota

La discussione che segue ha lo scopo di chiarire il concetto di iperlemma e l'uso di questo tipo di elementi, quando presenti, in sede di interrogazione di un corpus; le considerazioni riportate e relative alle operazioni di iperlemmatizzazione sono inserite per chiarezza, ma non si riferiscono ad azioni effettuabili nell'ambito di GattoWeb; questo programma si limita ad interrogare un corpus già lemmatizzato, ed eventualmente iperlemmatizzato, con GATTO.


Gli iperlemmi costituiscono uno strumento che amplia la possibilità di localizzare occorrenze di gruppi di forme interconnesse dal punto di vista semantico, grammaticale o di altra natura, al di là di quanto consentito dal ricorso ai lemmi. Gli iperlemmi sono in sostanza categorie che possono essere attribuite ai lemmi: tramite gli iperlemmi più lemmi possono essere associati tra loro e in seguito ricercati simultaneamente, senza necessità di essere specificati singolarmente. Uno stesso lemma può essere associato a più iperlemmi e cercato sulla base di uno qualunque di essi: ad esempio il lemma mela può essere associato agli iperlemmi frutta e cibo. Dall'esempio fatto si evidenzia che, all'interno di un corpus, possono liberamente coesistere lemmi e iperlemmi caratterizzati dalla stessa entrata lessicale (ad esempio cibo).

Per illustrare il concetto di iperlemma, si immagini che in un corpus sia stato definito un certo numero di lemmi relativi ad animali (cane, gatto, lepre, bue, aquila, falco, fringuello, piccione,..). Una ricerca relativa ad occorrenze di forme associate ad un lemma indicante un mammifero potrebbe essere impostata, ad esempio, come ricerca per lemmi di cane, gatto, ecc., con qualche rischio di incompletezza nel caso non si citino tutti i lemmi presenti. Esiste la possibilità di associare una volta per tutte a ciascuno dei primi 4 lemmi dell'esempio un iperlemma, diciamo l'iperlemma mammifero, con un meccanismo analogo a quello con cui si associano i lemmi alle forme.

A questo punto, una ricerca per iperlemmi, a partire dall'iperlemma mammifero, porterebbe agli stessi risultati di una ricerca per lemmi in cui sia stato specificato di cercare tutte le occorrenze relative a cane, gatto, lepre e bue.

Sempre con riferimento all'esempio iniziale, in modo analogo si potrebbe associare l'iperlemma uccello a aquila, falco, fringuello, piccione, con conseguenze analoghe.

Estendendo il concetto, possiamo pensare di introdurre l'iperlemma animale, associandolo non tanto a dei lemmi quanto agli iperlemmi mammifero e uccello. Una ricerca per iperlemmi dell'iperlemma animale porterebbe a localizzare tutte le occorrenze delle forme lemmatizzate con i lemmi a loro volta associati, risalendo questo schema di connessioni (tramite mammifero e uccello), all'iperlemma animale.

Nella terminologia di GattoWeb mammifero e uccello sono detti iperlemmi di livello 1, in quanto connessi direttamente a dei lemmi; animale è invece un iperlemma di livello 2, in quanto punta a iperlemmi di livello 1. È possibile definire liberamente iperlemmi di livelli superiori, purché esista una catena di connessioni che partendo da quei livelli scenda fino ad individuare uno o più lemmi presenti nel corpus.

Detto in altri termini, il meccanismo con cui gli iperlemmi consentono di raggruppare i lemmi può essere amplificato, raccogliendo tra loro iperlemmi di livello 1 tramite associazione a uno o più iperlemmi di livello 2, in maniera del tutto analoga a quanto fatto con i lemmi. In generale, iperlemmi di livello n possono essere associati a iperlemmi di livello n+1, purché esista una catena di associazioni che, percorsa a ritroso a partire dall'iperlemma di livello n+1, porti fino a un lemma attraverso i livelli n, n-1, .., 1; per coerenza di definizione da questo punto di vista un lemma potrebbe anche essere definito un iperlemma di livello 0.

Le forme (e relative occorrenze) potranno così essere cercate a partire da iperlemmi di qualunque livello, tramite la loro associazione a lemmi concatenati con gli iperlemmi indicati in avvio di ricerca.

Una ambiguità insita in questo meccanismo concerne la lemmatizzazione di occorrenze di una certa forma tramite un lemma al quale siano stati associati più iperlemmi di livello 1 (tra i quali, ma non necessariamente, uno potrebbe costituire una categoria prevalente): una occorrenza, lemmatizzata col lemma in oggetto, è da mettere in relazione o meno con uno di questi iperlemmi, e se sì con quale? Per risolvere questa ambiguità è possibile, in fase di lemmatizzazione di un'occorrenza, associarle non solo un lemma ma, volendo, anche un iperlemma di livello 1. Corrispondentemente è possibile impostare ricerche per iperlemmi specificando che le occorrenze che si intende localizzare sono solo quelle espressamente associate agli iperlemmi indicati. Come conseguenza, questo secondo tipo di ricerca per iperlemmi permette di limitare i contesti cercati alle occorrenze associate a specifiche coppie lemma-iperlemma.

In conclusione, un iperlemma può avere contemporaneamente connessioni con iperlemmi di livello superiore e con iperlemmi di livello inferiore (o lemmi se è un iperlemma di livello 1). Nell'esempio, mammifero (iperlemma di livello 1) è connesso verso l'alto (cioè al livello 2) con animale e verso il basso con i lemmi cane, gatto, lepre, bue.

L'insieme degli iperlemmi definiti in un corpus ne costituisce l'iperlemmario.

GattoWeb identifica univocamente un iperlemma mediante 3 attributi: grafia (obbligatoria), disambiguatore (facoltativo), livello (obbligatorio).




Vai all'indice
Vai alla pagina precedente Vai a inizio capitolo Vai alla pagina successiva