Guida a GattoWeb

glossario

stampa
Lemmatizzazione. Coppie forma-lemma


Prima di rendere disponibile un corpus per l'interrogazione si può procedere alla sua lemmatizzazione, selezionando di volta in volta le occorrenze sulle quali agire; questa selezione ha luogo a partire dalle forme di cui le occorrenze sono espressione e dai testi in cui sono inserite. In GATTO (e quindi in GattoWeb) lemmatizzare significa associare un certo lemma a una occorrenza specifica di una forma specifica in un testo specifico. Se il lemma utilizzato non era già presente nel lemmario del corpus vi viene aggiunto automaticamente. Nei riguardi della lemmatizzazione una forma polirematica opera come un tutt'uno, ovvero all'insieme delle parole componenti viene associato un lemma unico.

Una volta portata a termine, una lemmatizzazione ha una duplice conseguenza: realizza una connessione tra il lemma e la specifica occorrenza cui è stato associato ma in più crea una connessione a livello di corpus tra il lemma e la forma di cui l'occorrenza era espressione. Gli effetti di questi due legami sono i seguenti:


Connessione lemma - singola occorrenza

Si può risalire rapidamente all'occorrenza lemmatizzata effettuando una ricerca a partire dal lemma: chiedendo di mostrare direttamente i contesti si otterrano tutte le occorrenze lemmatizzate con quel lemma. E' anche possibile limitare la ricerca a una o più forme specifiche, anziché estenderla a tutte le forme lemmatizzate col lemma di partenza.


Connessione lemma - forma

Grazie a questa connessione una ricerca fatta a partire dal lemma permetterà di risalire a tutte le forme associate ad esso in uno o più testi del corpus (se però la ricerca è limitata ad un sottocorpus verranno prese in considerazione solo le associazioni forma - lemma derivanti da lemmatizzazioni effettuate all'interno del sottocorpus considerato); verranno mostrate sia le occorrenze lemmatizzate col lemma in questione che, volendo, quelle non lemmatizzate o lemmatizzate con altri lemmi; in questo caso il lemma agisce quindi come puntatore alla forma, lasciando poi l'utente libero di scegliere quali occorrenze di quest'ultima visualizzare effettivamente.

Questa connessione dà luogo a una coppia forma-lemma, meglio descritta nel paragrafo successivo.

Non è possibile associare più di un lemma ad una stessa occorrenza.

Nel corso della lemmatizzazione di una occorrenza è possibile associarle anche un iperlemma.


Coppia forma-lemma

Si intende con questo termine una coppia di elementi connessi tra loro a seguito di un'operazione di lemmatizzazione effettuata sul corpus. Se ad esempio in un certo testo del corpus una singola occorrenza della forma porta viene lemmatizzata con il lemma portare (verbo), questo legame, oltre ad essere specifico della occorrenza cui è stato applicato, dà luogo alla registrazione della coppia porta-portare in uno degli archivi del corpus. Da questo momento una ricerca per forme di porta, con attivazione dell'opzione mostra lemmi, avviata tramite il menu Avvia ricerca, mostrerà una riga contenente la coppia forma porta - lemma portare, insieme al numero di occorrenze (della forma porta esplicitamente lemmatizzate col lemma portare) presenti nel dominio di ricerca.

Un risultato analogo si otterrà impostando una ricerca per lemmi del lemma portare (verbo) con attivazione dell'opzione mostra forme.

La coppia forma-lemma generata dalla lemmatizzazione consente quindi di utilizzare sia i lemmi come strumenti per accedere alle forme collegate, che queste ultime come elementi per risalire ai lemmi.

Le ricerche tramite coppie forma-lemma non si limitano però alle sole occorrenze lemmatizzate, ma sono utilizzabili anche come punto di partenza per ricerche più ampie. Supponiamo di aver avviato una delle ricerche precedenti (per forme con opzione mostra lemmi o per lemmi con opzione mostra forme) mediante il menu Avvia ricerca; si immagini di selezionare la coppia porta-portare (v.) e di trasferirla nell'Accumulatore col menu Copia in accumulatore. Per default, proseguendo la ricerca col menu Mostra contesti, si otterrebbero tutti e soli i contesti delle occorrenze di porta lemmatizzate con portare (verbo): a conferma di questo fatto, nel lato sinistro della pagina, al centro, è presente il pannello verde tipi di contesti nel quale è attivo il checkbox col lemma indicato, il quale imposta appunto il suddetto default. E' però possibile, in alternativa, attivare ad esempio il secondo checkbox non lemmatizzati : in questo caso, pur essendo partita la ricerca da una coppia forma-lemma specifica, si può dirottarla verso le occorrenze non lemmatizzate della forma porta . Selezionando infine solo il terzo checkbox con altri lemmi si può chiedere di vedere tutte le occorrenze della forma porta lemmatizzate con lemmi diversi da portare (v.), magari col lemma porta (sostantivo femminile). Nell'ultimo esempio la forma ha agito come ponte tra un lemma di partenza e uno (diverso) di arrivo, quest'ultimo magari inizialmente ignoto all'utente.
E' possibile fare uso di una qualunque combinazione dei 3 checkbox del pannello tipi di contesti, combinandone così i risultati.





Vai all'indice
Vai alla pagina precedente Vai a inizio capitolo Vai alla pagina successiva