Guida a GattoWeb

glossario

stampa
Ricerche di cooccorrenze


note

Questa pagina, nel descrivere le procedure di ricerca previste in GattoWeb, fa riferimento allo schema dell'architettura del programma, in particolare per quanto riguarda i nomi delle pagine e i numeri dei corrispondenti livelli.

Durante l'utilizzo di GattoWeb, i menu Guide.. + guida di questa pagina forniscono informazioni sulle azioni possibili e sugli strumenti disponibili nella pagina aperta di volta in volta.

Dopo un salto ad altra parte di questa stessa pagina, si può tornare alla posizione precedente col tasto cancellazione all'indietro, ovvero quello posto sopra il tasto Invio.



Introduzione


Questo tipo di ricerca non si ripromette di localizzare singole occorrenze di determinate forme quanto piuttosto eventi più articolati, ovvero cooccorrenze nello stesso testo ed in prossimità tra di loro di occorrenze di forme precedentemente definite utilizzando i criteri utilizzati per gli altri tipi di ricerche: infatti le parole cercate possono essere specificate direttamente sulla base del loro assetto grafico, oppure partendo dai lemmi associati o dalle relative categorie. Si può inoltre fare uso dei segni di interpunzione sia per fissare in relazione ad essi la posizione delle parole da localizzare sia come elementi da ricercare di per sè. Le cooccorrenze possono essere ulteriormente caratterizzate sulla base di parametri aggiuntivi combinabili tra loro, ovvero distanza massima tra gli elementi costituenti e appartenenza o meno ad uno stesso periodo.

Il compito di stabilire quando un gruppo di parole consecutive o prossime tra loro costituisce effettivamente un'occorrenza distinta da segnalare come tale, a dispetto di quanto può sembrare, è tutt'altro che semplice. Per una discussione su questo punto vedere Criteri adottati per definire le cooccorrenze da estrarre dai testi.



Tipi di ricerche di cooccorrenze previsti in GattoWeb


Ricerche di prossimità

Vengono cercati tutti i brani in cui due o più parole si trovano a distanza ravvicinata tra di loro. Le parole possono essere disposte in qualunque ordine, salvo rispettare i vincoli imposti dalle opzioni; in particolare dovranno essere tutte comprese entro un intervallo massimo di N parole (incluse le parole estreme). N vale in partenza 10 ma può essere ridotto agendo sull'opzione entro parole di testo.

Ad esempio, la ricerca di casa madre cercherà tutti i brani nei quali una occorrenza della parola casa compare a distanza non maggiore di N parole (nel senso spiegato prima) da una occorrenza della parola madre.


Ricerche di stringhe

In questo caso si cerca una sequenza di parole, che devono comparire consecutivamente, nell'ordine in cui sono riportate.

Ad esempio, la ricerca di "casa madre" cercherà tutti i brani nei quali compare l'esatta sequenza ...casa madre....


Ricerche combinate di prossimità e stringhe

Si tratta di ricerche di prossimità nelle quali gli elementi cercati anziché singole parole possono essere delle stringhe (nel senso definito nel caso precedente). Gli elementi devono ancora rientrare complessivamente in un'area di testo non maggiore dell'intervallo di ricerca e possono trovarsi disposti in ordine qualunque, ma le parole costituenti le stringhe sono mutuamente vincolate.

Ad esempio, una ricerca di questo tipo potrebbe essere chiesa "casa madre" "ordine religioso": in questo caso la ricerca ha successo se localizza la stringa casa madre in prossimità dell'altra stringa ordine religioso e della parola chiesa; le due stringhe e la parola possono susseguirsi in un ordine qualunque ma devono essere comprese complessivamente entro 10 (o meno) parole di testo.



Regole di codifica nell'impostazione di una ricerca di cooccorrenze


La cooccorrenza viene definita tramite un'unica stringa di caratteri da introdurre nel riquadro bianco posto nella parte alta della pagina. Le parole da cercare separatamente vanno digitate così come sono; le stringhe intese come sequenze di parole consecutive vanno racchiuse tra virgolette. Ad esempio, per cercare le parole cavallo e bianco digitare cavallo bianco; per cercare la sequenza cavallo bianco digitare "cavallo bianco".

Per specificare gli elementi costituenti la cooccorrenza da cercare vanno seguite alcune regole elencate nel seguito (vedere anche gli esempi):



Avvio di una ricerca di cooccorrenze (livello 1)


Una volta avviato GattoWeb e cliccato sul nome del corpus si arriva alla prima pagina, intitolata scelta dell'operazione. Specificare il tipo di ricerca selezionando i menu Ricerche di contesti.. cooccorrenze/interpunzioni (o Ricerche.. cooccorrenze/interpunzioni). Si accede così alla pagina di impostazione della ricerca (livello 2) intitolata ricerca di cooccorrenze, ovvero quella nella quale vanno introdotti i dati di partenza.




Impostazione della ricerca (livello 2)


Inserimento dei dati

Per impostare la ricerca digitare nel riquadro bianco la stringa che descrive le cooccorrenze da cercare, rispettando la sintassi descritta nei paragrafi precedenti.


Opzioni disponibili

Le opzioni disponibili possono variare da corpus a corpus: qui sono descritte tutte quelle previste dal programma, indipendentemente dalla loro applicazione o meno ai vari corpora.


entro un periodo

(opzione inserita nel pannello intervallo di ricerca). Se attivata, implica che le parole e/o stringhe cooccorrenti, fermo restando il vincolo di distanza massima, devono comunque trovarsi all'interno di uno stesso periodo. Questa opzione è incompatibile con la ricerca di punteggiatura forte. Ad esempio, la ricerca di "abiti P, gioielli" è compatibile con l'opzione entro un periodo, mentre quella di "abiti P; gioielli" non lo è.


entro N parole di testo (max 10)

(opzione inserita nel pannello intervallo di ricerca). Se non attivata, si applica comunque il limite massimo di 10 parole; se attivata riduce la lunghezza dell'intervallo di ricerca, la cui lunghezza non può comunque essere inferiore al numero di parole cooccorrenti cercate.


Ricerca limitata a uno o più sottocorpora

Le ricerche effettuate con GattoWeb per default si estendono a tutti i testi che costituiscono il corpus. Peraltro l'utilizzo dei sottocorpora, qualora si vogliano limitare le ricerche ad un sottoinsieme del corpus, è estremamente semplice (si fa l'ipotesi che i sottocorpora desiderati siano stati già definiti).

Si comincia impostando la stringa di ricerca e le opzioni desiderate esattamente come per le ricerche estese all'intero corpus. A questo punto si fa ricorso al pannello dominio di ricerca presente in alto a sinistra. Questo pannello contiene un checkbox corpus inizialmente attivato e altri 6 checkbox, denotati dalle lettere da A a F. Di questi solo quelli riferiti a sottocorpora attualmente definiti sono abilitati (scritta in colore nero), mentre gli altri non lo sono (scritta in colore grigio).

Per limitare la ricerca a uno o più sottocorpora, tra quelli attualmente definiti, è sufficiente attivare i corrispondenti checkbox, disattivando contemporaneamente il checkbox corpus.

Notare che se una ricerca venisse effettuata attivando contemporaneamente il checkbox corpus e uno o più checkbox relativi ai sottocorpora, questi ultimi verrebbero ignorati e la ricerca sarebbe eseguita estendendola a tutto il corpus.


Esecuzione della ricerca

Per eseguire la ricerca delle cooccorrenze e visualizzarle nella pagina risultati della ricerca (contesti multipli) (livello 5) utilizzare il menu Mostra contesti.


Funzioni degli altri menu presenti nella pagina

Cancella i dati..

A seconda del sottomenu scelto, rimuove soltanto il contenuto del riquadro bianco (stringa di ricerca) o ripristina anche le opzioni alla loro impostazione iniziale.


Vai a..

Tramite i suoi sottomenu consente di saltare alle altre pagine attualmente accessibili, cioè già popolate con dei dati.


Riavvia GattoWeb

Riporta alla pagina iniziale del programma, consentendo di passare all'interrogazione di un altro corpus.


Guide..

Accesso alle guide in linea disponibili.

Guida di questa pagina: fornisce informazioni dettagliate sull'uso e gli strumenti disponibili nella pagina di GattoWeb aperta in quel momento.

Guida a GattoWeb: apre la Guida cui appartiene questa stessa pagina di spiegazioni, a partire dalla pagina iniziale contenente l'indice completo della Guida.

Guida del corpus testuale: fornisce informazioni sul contenuto del corpus testuale attualmente aperto; l'esatta dicitura di questo sottomenu dipende dal corpus.




Risultati della ricerca (contesti multipli) (livello 5)


Risultati presentati e dati relativi ai contesti (visualizzazione standard)

La pagina contiene le occorrenze ottenute come risultato finale della ricerca. Ogni cooccorrenza è inserita in un contesto formato normalmente da 31 parole. Il contesto può essere di lunghezza inferiore in quanto viene comunque tagliato in corrispondenza dei limiti del riferimento organico nel quale l'occorrenza si colloca.

Ogni contesto è preceduto da una riga di testata che include una serie di informazioni relative all'occorrenza. Alcune delle zone della testata sono cliccabili per accedere ad altri dati o per svolgere determinate funzioni. Per i dettagli relativi alla struttura e ai contenuti delle righe di testata vedere la Guida della pagina


Risultati presentati e dati relativi ai contesti (visualizzazione kwic)

Anche in questa visualizzazione la pagina contiene le cooccorrenze ottenute come risultato finale della ricerca; ogni occorrenza è inserita in un breve contesto. Ad ogni occorrenza è destinata una riga, che include un breve contesto preceduto da alcune informazioni relative all'occorrenza. Alcune zone di questa parte iniziale sono cliccabili per accedere ad altri dati o per svolgere determinate funzioni. Il contesto viene comunque tagliato in corrispondenza dei limiti del riferimento organico nel quale l'occorrenza si colloca. Per i dettagli relativi alla struttura e ai contenuti delle righe kwic vedere la Guida della pagina


Statistiche - Navigazione tra i contesti

Il pannello bianco-verde in alto a sinistra contiene informazioni statistiche relative alle occorrenze localizzate ed espone gli strumenti, pulsanti e caselle necessari per spostarsi tra di esse. Si possono determinare due situazioni diverse, a seconda che la ricerca delle cooccorrenze sia stata o meno completata. Il caso della ricerca completata si riconosce in quanto il contenuto del pannello bianco termina appunto con la dicitura ricerca completata. Le due situazioni danno luogo a meccanismi di navigazione un po' diversi (ved. Ricerca completata e Ricerca non completata).


Ordinamento dei contesti

I contesti vengono ordinati per testi e, a parità di testo, per ordine di apparizione al suo interno.


Selezione dei contesti - Annullamento della selezione

La selezione dei contesti serve per indicare quelli che si vogliono salvare su file, fissandone al contempo la geometria. La selezione (e la deselezione) si applica a tutti i contesti ottenuti e non è quindi limitata a quelli presentati nella pagina corrente. La selezione può essere effettuata ricorrendo a due strumenti:

Menu Selezione il quale apre una pagina nella quale si possono indicare i contesti da salvare e il formato con cui salvarli. Per dettagli sull'uso di questa pagina, vedere la descrizione relativa, un po' diversa a seconda che la ricerca sia stata completata o non sia stata completata.

Checkbox presente nella riga di testata di ogni contesto che si vuole salvare. Attivandolo, il corrispondente contesto verrà selezionato e sarà trascritto su file esattamente come appare a video al momento.

Per deselezionare tutti i contesti selezionati usare il menu Annulla selezione.


Salvataggio di contesti - Opzioni di salvataggio

Volendo trasferire nel proprio computer i contesti ottenuti dopo averli selezionati utilizzare il menu Salva: non viene formulata nessuna richiesta in quanto il salvataggio riguarda automaticamente tutti e soli i contesti selezionati. Prima di effettuare l'operazione verificare l'impostazione delle voci riportate nel pannello opzioni di "Salva", il cui significato è descritto nella tabella che segue.


se al contesto sono associate delle note o una traduzione in altra lingua, le stampa insieme al contesto
se il contesto è lemmatizzato o iperlemmatizzato stampa anche i dati del lemma e dell'iperlemma utilizzati
se al testo è attribuito un indice di qualità, questo viene stampato unitamente al contesto (opzione disponibile solo in combinazione con il formato redazionale)
è il formato di default per il salvataggio dei contesti
formato alternativo al precedente: stampa i contesti secondo uno schema più adatto per scopi di redazione lessicografica

Altre modalità di visualizzazione dei risultati

La pagina risultati della ricerca a contesti multipli visualizzati in modalità standard non è l'unica forma con cui possono essere presentati i risultati di una ricerca. Le altre forme sono:


contesti multipli in modalità kwic

(descritta precedentemente in questa stessa pagina)


contesto singolo

viene mostrato un solo contesto per volta, consentendo di ampliarne la dimensione e di assegnargli una diversa geometria (lunghezza definita dall'utente in numero di parole, periodi, brani o per indicazione diretta degli estremi)


Funzioni degli altri menu presenti nella pagina

Vai a..

Tramite i suoi sottomenu consente di saltare alle altre pagine attualmente accessibili, cioè già popolate con dei dati.


Riavvia GattoWeb

Riporta alla pagina iniziale del programma, consentendo di passare all'interrogazione di un altro corpus.


Guide..

Accesso alle guide in linea disponibili.

Guida di questa pagina: fornisce informazioni dettagliate sull'uso e gli strumenti disponibili nella pagina di GattoWeb aperta in quel momento.

Guida a GattoWeb: apre la Guida cui appartiene questa stessa pagina di spiegazioni, a partire dalla pagina iniziale contenente l'indice completo della Guida.

Guida del corpus testuale: fornisce informazioni sul contenuto del corpus testuale attualmente aperto; l'esatta dicitura di questo sottomenu dipende dal corpus.




Risultati della ricerca (contesto singolo) (livello 5)


In questa pagina viene mostrato un solo contesto per volta, consentendo di ampliarne la dimensione e di assegnargli una diversa geometria (lunghezza definita dall'utente in numero di parole, periodi, brani o per indicazione diretta degli estremi). Si tratta di una pagina abbastanza tecnica per la cui descrizione si rimanda alla specifica pagina della Guida




Vai all'indice
Vai alla pagina precedente Vai a inizio capitolo Vai alla pagina successiva