Guida a GattoWeb

glossario

stampa
Lemmi muti e coppie forma-lemma mute


Nella pagina precedente si è fatto cenno ai meccanismi di lemmatizzazione e agli effetti di tali operazioni.

Ciò che non è stato detto, in quanto riguarda essenzialmente la fase di lemmatizzazione di un corpus piuttosto che quella di interrogazione, è che un lemma sopravvive negli archivi di un corpus fino a che esiste almeno una occorrenza lemmatizzata con tale lemma; analogamente una coppia forma-lemma sopravvive fino a che esiste almeno una occorrenza della forma lemmatizzata col lemma. Se queste condizioni vengono meno (per cancellazione di testi dal corpus o per modifica delle lemmatizzazioni esistenti), il lemma o la coppia forma-lemma vengono cancellati automaticamente dagli archivi. Questo meccanismo, ottimale per una serie di considerazioni che non hanno rilevanza in questa sede, impedisce però di fatto di utilizzare il lemmario costruito con un corpus come base per lemmatizzare o interrogare un corpus diverso.

Per risolvere il problema sono stati introdotti in GATTO e GattoWeb due nuovi elementi: lemmi muti e coppie forma-lemma mute. Si tratta di lemmi e connessioni lemma-forma presenti e disponibili negli archivi di un corpus anche se non collegati ad alcuna occorrenza lemmatizzata; in questo modo elementi non derivanti dalla lemmatizzazione effettuata sul corpus (ma da quella di un altro corpus) possono essere assunti come base per le operazioni di interrogazione del corpus stesso.

La precedente affermazione può lasciare perplessi dal momento che si tratta di oggetti i quali per definizione non puntano a niente. In realtà è possibile utilizzarli facendo uso del meccanismo già descritto nella pagina relativa alle coppie forma-lemma: ad esempio, per utilizzare una coppia forma-lemma muta, si deve avviare una ricerca per lemmi attivando l'opzione mostra forme, o per forme attivando l'opzione mostra lemmi, che abbiano come oggetto la forma o il lemma inclusi nella coppia; si avvia la ricerca con il menu Avvia ricerca e successivamente si continua con Copia in accumulatore; se la ricerca venisse ulteriormente proseguita semplicemente ricorrendo al menu Mostra contesti non si otterrebbe alcun risultato, dal momento che nel corpus non esistono occorrenze di quella forma lemmatizzate con quel lemma; nell'Accumulatore si deve invece, prima di cliccare sul menu Mostra contesti, attivare almeno uno tra i due checkbox non lemmatizzati e con altri lemmi presenti nel pannello verde tipi di contesti (a sinistra nella pagina): in questo modo la ricerca è dirottata verso le occorrenze non lemmatizzate col lemma in questione, consentendo quindi di localizzarle pur essendo partiti da un lemma non presente nel corpus, appunto un lemma muto.




Vai all'indice
Vai alla pagina precedente Vai a inizio capitolo Vai alla pagina successiva