Guida a GattoWeb

glossario

stampa
Definizione di sottocorpora e loro utilizzo nelle ricerche


Le ricerche effettuate con GattoWeb per default sono riferite all'intero corpus. In certi casi è però utile poter limitare la ricerca a uno o più testi del corpus, caratterizzati dall'appartenenza ad uno stesso periodo, area linguistica, tipologia, o magari dall'essere stati scritti dallo stesso autore. Per consentire questa operazione GattoWeb consente di definire in maniera dinamica dei sottocorpora, ovvero dei sottoinsiemi di testi selezionati tra quelli appartenenti al corpus. Una volta operata questa definizione e fino a che non viene abbandonato GattoWeb o non si passa ad un altro corpus ogni ricerca può essere effettuata, a scelta, sull'intero corpus oppure su uno o più dei sottocorpora definiti in quel momento; poiché uno stesso testo può essere incluso in più sottocorpora GattoWeb provvede automaticamente a rimuovere eventuali duplicati dai risultati ottenuti.

I sottocorpora diversi che si possono definire contemporaneamente sono al massimo 6. È sempre possibile modificarne la composizione aggiungendo o togliendo testi o costruire nuovi sottocorpora, sempre entro il predetto limite di 6 contemporanei.

L'insieme di testi sui quali opera una ricerca, sia esso costituito dall'intero corpus o da una combinazione di sottocorpora, è indicato col termine dominio di ricerca.

Ogni sottocorpus è indicato con una lettera maiuscola, da A a F. I titoli delle pagine di ricerca indicano sempre qual'è la struttura del dominio di ricerca corrente, con diciture come (intero corpus), (sottoc. A, B, C) o (testo XXX) dove XXX sta per la sigla del testo.

I testi da includere in un sottocorpus vengono individuati sulla base di una o più condizioni applicate ai dati bibliografici relativi, compresi la sigla e l'anno o il periodo cronologico associato al testo.



Come definire dei sottocorpora
Verrà ora visto concretamente come costruire e modificare la struttura dei sottocorpora. Una volta avviato GattoWeb e cliccato sul nome del corpus si arriva alla prima pagina, intitolata scelta dell'operazione. Da qui si passa alla pagina definizione dei sottocorpora mediante i menu Altre funzioni.. + definizione di sottocorpora. La pagina è divisa in 3 pannelli, sempre visibili, più una griglia che mostra i dati bibliografici dei testi appartenenti al sottocorpus selezionato al momento (sottocorpus cui è assegnato un pallino nero nel corrispondente option box nel pannello sottocorpus; la griglia è posta nella parte bassa della pagina e non compare se il sottocorpus selezionato è vuoto (come sono in partenza tutti i sottocorpora).
Dei 3 pannelli, quello in alto a sinistra, sottocorpus, permette di individuare, tramite una lettera identificativa, il sottocorpus che si vuole definire o modificare; quello al centro in alto serve per specificare i dati bibliografici in base ai quali vanno selezionati i testi che devono fare parte del sottocorpus; quello a sinistra denominato selezione cronologica consente di selezionare i testi sulla base di criteri cronologici.



Costruzione di un nuovo sottocorpus

Per definire un nuovo sottocorpus bisogna inizialmente decidere quale lettera identificativa assegnargli, agendo sugli option box del pannello sottocorpus. A questo punto vanno inseriti nel pannello centrale i dati relativi agli elementi bibliografici in base ai quali si intende definire i testi. Supponendo di voler costituire il sottoscorpus B formato dai testi di tipo documentale di un certo autore, digitare il nome dell'autore nella casella autore e selezionare doc. nel menu a tendina genere. Per costruire effettivamente il sottocorpus sulla base di questi dati usare i menu Opera selezione.. + nuova; se nel corpus vi sono testi che soddisfano queste condizioni si aprirà in basso la griglia contenente tutti i dati bibliografici di tali testi. Ad ogni casella è associato anche un checkbox escludi: se attivato, significa che i testi che soddisfano il parametro impostato nella casella corrispondente vanno tolti dal sottocorpus formato sulla base dei dati impostati nelle altre caselle. Ad esempio, se si volesse costruire un sottocorpus di tutti i testi di autore anonimo, con esclusione del testo definito dalla sigla IW, si dovrebbe digitare anonimo nella casella autore, iw nella casella sigla e attivare il checbox escludi posto a destra di quest'ultima. Per costruire il sottocorpus, al solito, agire sui menu Opera selezione.. + nuova



Aggiunta di testi in un sottocorpus già definito

La struttura di un sottocorpus può essere modificata in qualunque momento aggiungendovi dei testi con un meccanismo molto simile a quello utilizzato per definirlo inizialmente. Si tratta, previa selezione del sottocorpus nel pannello sottocorpora, di inserire nel solito pannello in alto i dati bibliografici relativi ai nuovi testi, anche in questo caso potendosi utilizzare eventualmente i checbox escludi; una volta impostati i dati procedere all'integrazione dei nuovi testi nel sottocorpus con i menu Opera selezione.. + aggiuntiva. Eventuali testi appartenenti alla nuova selezione che risultassero già presenti nel sottocorpus non vi verranno inseriti.



Rimozione di testi da un sottocorpus

Si opera con un meccanismo identico a quello del caso precedente: i testi definiti dai nuovi dati bibliografici impostati verranno rimossi dal sottocorpus selezionato nel pannello sottocorpus utilizzando i menu Opera selezione.. + restrittiva.



Sostituzione del contenuto di un sottocorpus

Volendo ridefinire completamente il contenuto di un sottocorpus già esistente, selezionarlo nel pannello sottocorpus, poi impostare i dati bibliografici dei nuovi testi alla solita maniera e infine usare i menu Opera selezione.. + nuova, come se si trattasse di un sottocorpus nuovo.



Cancellazione di tutti i dati impostati

Per effettuare questa operazione, utilizzare il menu Azzera impostazioni.



Selezioni su base cronologica

In aggiunta o in alternativa alle impostazioni effettuate utilizzando il pannello centrale, è possibile selezionare i testi sulla base di criteri cronologici, facendo riferimento all'anno o al periodo associato ad ogni testo. Si utilizza in questo caso il pannello selezione cronologica. Il meccanismo verrà illustrato con alcuni esempi.


Sottocorpus formato dai testi di un anno compreso (o di un periodo almeno parzialmente compreso) tra gli anni 1280 e 1300.

Nel pannello selezione cronologica impostare 1280 nella casella anno iniziale e 1300 nella anno finale.


Sottocorpus formato dai testi dell'anno 1315.

Nel pannello selezione cronologica tramite il box a tendina impostare Anno esatto, poi digitare 1315 nella casella anno.


Sottocorpus formato dai testi cui è associato un periodo che include l'anno 1274.

Nel pannello selezione cronologica tramite il box a tendina impostare Anno compreso, poi digitare 1274 nella casella anno.



Salvataggio dei dati bibliografici di un sottocorpus

Selezionare il sottocorpus del quale si desiderano salvare i dati, usando il pannello sottocorpus, poi avviare l'operazione col menu Salva. Sula sinistra comparirà un nuovo pannello, dati da salvare, tramite il quale è possibile specificare quali sono i dati bibliografici che interessa riportare in un file. Una volta attivati i check box corrispondenti ai campi di interesse, continuare l'operazione col pulsante procedi o annullarla con annulla.



Utilizzo dei sottocorpora nelle ricerche

Le ricerche effettuate con GattoWeb per default si estendono a tutti i testi che costituiscono il corpus. Peraltro l'utilizzo dei sottocorpora, qualora si vogliano limitare le ricerche ad un sottoinsieme del corpus, è estremamente semplice e uguale per tutti i tipi di ricerche.

Come primo passo è necessario, ovviamente, definire la composizione dei sottocorpora che si intende utilizzare. A questo riguardo è importante notare che, qualora una ricerca sia estesa a due o più sottocorpora e vi siano testi presenti in più di un sottocorpus, gli eventuali risultati duplicati verranno automaticamente rimossi dal programma (in pratica in questo caso GattoWeb opera su un unico sottocorpus interno, diverso da quelli definiti dall'utente, sottocorpus formato da tutti i testi, contati una sola volta, inclusi nei sottocorpora scelti).

Tornando all'esecuzione di ricerche limitate a dei sottocorpora, queste vanno impostate esattamente come quelle estese all'intero corpus. Una volta inseriti i dati di partenza e selezionate le opzioni, si fa ricorso al pannello dominio di ricerca presente in tutte le pagine di impostazione delle ricerche. Questo pannello contiene un checkbox corpus inizialmente attivato e altri 6 checkbox, denotati dalle lettere da A a F. Di questi solo quelli riferiti ai sottocorpora attualmente definiti sono abilitati (scritta in colore nero), mentre gli altri non lo sono (scritta in colore grigio).

Per limitare la ricerca a uno o più sottocorpora, tra quelli attualmente definiti, è sufficiente attivare i corrispondenti checkbox, disattivando contemporaneamente il checkbox corpus.

Notare che se una ricerca venisse effettuata attivando contemporaneamente il checkbox corpus e uno o più checkbox relativi ai sottocorpora, questi ultimi verrebbero ignorati e la ricerca sarebbe eseguita semplicemente estendendola a tutto il corpus.




Vai all'indice
Vai alla pagina precedente Vai a inizio capitolo Vai alla pagina successiva