Guida a GattoWeb |
||
Lemmatizzazione. Coppie forma-lemma |
Prima di rendere disponibile un corpus per l'interrogazione si può procedere alla sua lemmatizzazione, selezionando di volta in volta le occorrenze sulle quali agire; questa selezione ha luogo a partire dalle forme di cui le occorrenze sono espressione e dai testi in cui sono inserite. In GATTO (e quindi in GattoWeb) lemmatizzare significa associare un certo lemma a una occorrenza specifica di una forma specifica in un testo specifico. Se il lemma utilizzato non era già presente nel lemmario del corpus vi viene aggiunto automaticamente. Nei riguardi della lemmatizzazione una forma polirematica opera come un tutt'uno, ovvero all'insieme delle parole componenti viene associato un lemma unico.
Una volta portata a termine, una lemmatizzazione ha una duplice conseguenza: realizza una connessione tra il lemma e la specifica occorrenza cui è stato associato ma in più crea una connessione a livello di corpus tra il lemma e la forma di cui l'occorrenza era espressione. Gli effetti di questi due legami sono i seguenti:
Si può risalire rapidamente all'occorrenza lemmatizzata effettuando una ricerca a partire dal lemma: chiedendo di mostrare direttamente i contesti si otterrano tutte le occorrenze lemmatizzate con quel lemma. E' anche possibile limitare la ricerca a una o più forme specifiche, anziché estenderla a tutte le forme lemmatizzate col lemma di partenza.
Grazie a questa connessione una ricerca fatta a partire dal lemma permetterà di risalire a tutte le forme associate ad esso in uno o più testi del corpus (se però la ricerca è limitata ad un sottocorpus verranno prese in considerazione solo le associazioni forma - lemma derivanti da lemmatizzazioni effettuate all'interno del sottocorpus considerato); verranno mostrate sia le occorrenze lemmatizzate col lemma in questione che, volendo, quelle non lemmatizzate o lemmatizzate con altri lemmi; in questo caso il lemma agisce quindi come puntatore alla forma, lasciando poi l'utente libero di scegliere quali occorrenze di quest'ultima visualizzare effettivamente.
Questa connessione dà luogo a una coppia forma-lemma, meglio descritta nel paragrafo successivo.
Non è possibile associare più di un lemma ad una stessa occorrenza.
Nel corso della lemmatizzazione di una occorrenza è possibile associarle anche un iperlemma.
Si intende con questo termine una coppia di elementi connessi tra loro a seguito di un'operazione di lemmatizzazione effettuata sul corpus. Se ad esempio in un certo testo del corpus una singola occorrenza della forma porta viene lemmatizzata con il lemma portare (verbo), questo legame, oltre ad essere specifico della occorrenza cui è stato applicato, dà luogo alla registrazione della coppia porta-portare in uno degli archivi del corpus. Da questo momento una ricerca per forme di porta, con attivazione dell'opzione mostra lemmi, avviata tramite il menu Avvia ricerca, mostrerà una riga contenente la coppia forma porta - lemma portare, insieme al numero di occorrenze (della forma porta esplicitamente lemmatizzate col lemma portare) presenti nel dominio di ricerca.
Un risultato analogo si otterrà impostando una ricerca per lemmi del lemma portare (verbo) con attivazione dell'opzione mostra forme.
La coppia forma-lemma generata dalla lemmatizzazione consente quindi di utilizzare sia i lemmi come strumenti per accedere alle forme collegate, che queste ultime come elementi per risalire ai lemmi.
Le ricerche tramite coppie forma-lemma non si limitano però alle sole
occorrenze lemmatizzate, ma sono utilizzabili anche come punto di partenza per
ricerche più ampie. Supponiamo di aver avviato una delle ricerche precedenti (per
forme con opzione mostra lemmi o per lemmi con opzione mostra
forme) mediante il menu Avvia ricerca; si immagini di
selezionare la coppia porta-portare (v.) e di trasferirla nell'Accumulatore
col menu Copia in accumulatore. Per default, proseguendo la ricerca col
menu Mostra contesti, si otterrebbero tutti e soli i contesti delle
occorrenze di porta lemmatizzate con portare (verbo): a conferma
di questo fatto, nel lato sinistro della pagina, al centro, è presente il
pannello verde tipi di contesti nel quale è attivo il checkbox col lemma
indicato, il quale imposta appunto il suddetto default. E' però
possibile, in alternativa, attivare ad esempio il secondo checkbox non
lemmatizzati : in questo caso, pur essendo partita la ricerca da una
coppia forma-lemma specifica, si può dirottarla verso le occorrenze non
lemmatizzate della forma porta . Selezionando infine solo il
terzo checkbox con altri lemmi si può chiedere di vedere tutte le
occorrenze della forma porta lemmatizzate con lemmi diversi da portare
(v.), magari col lemma porta (sostantivo femminile). Nell'ultimo
esempio la forma ha agito come ponte tra un lemma di partenza e uno
(diverso) di arrivo, quest'ultimo magari inizialmente ignoto all'utente.
E' possibile fare uso di una qualunque combinazione dei 3 checkbox del pannello tipi
di contesti, combinandone così i risultati.
Vai all'indice | ||
Vai alla pagina precedente | Vai a inizio capitolo | Vai alla pagina successiva |