Guida a GattoWeb

glossario

stampa
Esempi di impostazione di ricerche di occorrenze con opzioni e caratteri jolly


Caratteri jolly utilizzabili in GattoWeb


*

L'asterisco sta per una stringa qualunque o nessun carattere.

Ad esempio pal* sta per tutte le parole che cominciano per pal; *dare* sta per tutte le parole che includono la sottostringa dare (o che coincidono con essa).


?

Il punto interrogativo sta per un carattere qualunque.

Ad esempio punt? si riferisce a tutte le parole di 5 caratteri, i primi 4 dei quali sono punt; ??? indica tutte le parole di 3 caratteri.


[x-y] (dove x e y indicano due lettere qualunque)

Questa stringa jolly indica la presenza di una lettera, che può essere la lettera rappresentata da x, quella rappresentata da y o una qualunque altra lettera intermedia tra le due nell'ordinamento alfabetico.

Quindi ri[d-g]are può stare per ridare, rifare, rigare, ecc. .


[xyz] (dove x, y, z indicano lettere qualunque)

Questa stringa jolly indica la presenza di una lettera, che può essere una qualunque tra le lettere rappresentate da x, y, z.

Quindi ri[gmd]are può stare per rigare, rimare o ridare.


<stringa1,stringa2> indica la presenza di una stringa tra quelle incluse tra le parentesi angolari e separate da virgole (compresa un'eventuale stringa vuota)

Questa stringa jolly è particolarmente potente in quanto piuttosto versatile, come illustrato negli esempi che seguono (esempi più elaborati sono riportati nel seguito di questa pagina):

sott<il,errar>e sta per sottile o sotterrare.

<at,ri,>tirare sta per attirare, ritirare o tirare Altre scritture equivalenti alla precedente sono ad esempio <ri,,at>tirare e <,at,ri>tirare.

vo<?,lteggi>are può stare sta per vocare, volare, votare, volteggiare.

<casa,barca,tesoro> sta per casa, barca o tesoro. Questo esempio mostra come utilizzare questa stringa jolly per inserire più di una parola nei selettori dove ne è formalmente prevista una sola.




Esempi di ricerche per forme, inclusi i caratteri jolly e le opzioni


abate

Questo caso è il più semplice: impostare abate in un selettore; non ci sono caratteri jolly e la risposta sarà, se esiste nei testi del corpus, l'unica forma abate.


ricerca di re, regine e principi

Impostare separatamente in 3 selettori le 3 forme re, regine e principi.


abat?

Si otterranno ad esempio le forme abate e abati


casa*

Si otterranno tutte le forme che cominciano per casa, come casale, casato, casacca, ma anche casa.


f*are

Si otterranno tutte le forme che cominciano con f e terminano con are.


fo[n-s]t?

Questa ricerca troverà tutte le parole di 5 caratteri che cominciano per fo, hanno come terza lettera un carattere compreso tra n e s (inclusi), seguito da t e da un carattere qualunque. Perciò tra i risultati di questa ricerca vi potranno essere anche fonte, forte, forti, foste.

Questo esempio mostra come i caratteri jolly siano combinabili tra loro, per imporre più condizioni alle stesse forme.


pa[rtc]to

Questa ricerca troverà tutte le parole di 5 caratteri che cominciano per pa, hanno come terza lettera r, t o c e terminano con to. Perciò si troveranno, se presenti nel corpus, parto, patto e pacto.


re<gat,g?l,m*>are

Le parentesi angolari consentono di racchiudere al loro interno più stringhe alternative di lunghezza diversa, anche nulla, separate da virgole. A loro volta tali stringhe possono includere i caratteri jolly ? e *.

L'esempio in questione localizzerebbe, tra l'altro, regatare, regalare, regolare, remare, remigare, remunerare.


me<n,,nom><dic*,s*,><a,e>re

In questo caso sono usate più parentesi angolari contemporaneamente; la prima e la seconda contengono anche stringhe nulle, indicate rispettivamente con due virgole consecutive e con una virgola non seguita da altri caratteri a fine parentesi. Tra le forme che si potrebbero ottenere, ci sono medicare, medichinare, menare, menomare, mesere, messere, mestiere. La ricerca mostrata riguarda tutte le parole che:

Notare che la presenza della stringa nulla nella prima e nella seconda coppia di parentesi rende la presenza delle stringhe indicate al loro interno facoltativa (...possono... anziché ...devono ...).


Ricerca di casa e della variante chasa, singolare e plurale

Per effettuare questa ricerca basta impostare la stringa c<,h>as<a,e>.


Ricerca delle forme riconducibili alla famiglia lessicale adulterare

Una possibile stringa è: <,a><b,d,v><o,u><l,r><t,d><,e,o,u>r*

L'esempio riportato ha lo scopo di mostrare come, utilizzando opportunamente certe funzionalità, sia possibile impostare ricerche molto ampie: quella presentata cerca, contemporaneamente, 192 gruppi di forme (2 x 3 x 2 x 2 x 2 x 4, prodotto delle varianti rese possibili dalle 6 coppie di parentesi), ognuno definito in base ai caratteri iniziali (infatti il selettore termina in tutti i casi con *).


Ricerca di tutte le forme che iniziano con la radice cas, escluse quelle che iniziano, più in particolare, con la radice cast

Digitare in un selettore la stringa cas*; digitare in un secondo selettore la stringa cast*, attivando in corrispondenza di questo secondo selettore il checkbox escl. elem..


Ricerca di tutte le forme alfabeticamente precedenti abaco

Digitare in un selettore la stringa abaco; cliccare sul menu a tendina posto a sinistra della stringa digitata e selezionare il simbolo <.


Ricerca della forma çasa

Digitare in un selettore la stringa casa e attivare il corrispondente checkbox ric. esp.; procedere col menu Avvia ricerca e selezionare tra le forme ottenute, se presente, çasa per proseguire la ricerca. Questa tecnica è utile ogni volta che si vogliano cercare forme (o lemmi) caratterizzati dalla presenza di diacritici non presenti in tastiera.


Ricerca delle forme casa e ccasa

Il sistema più ovvio è quello di digitare in un selettore casa e in un altro ccasa. Esiste anche la possibilità di utilizzare un unico selettore, digitando al suo interno la stringa casa ed attivando il corrispondente checkbox iniz. radd..




Ricerca per forme da un brano con uso dell'opzione spezza dopo diacritico


Questa è un'opzione non semplice da utilizzare, e ha una funzione piuttosto tecnica. Conviene limitarne l'uso ai casi per i quali sia effettivamente necessaria.


Nella preparazione dei testi destinati ad essere inseriti in un corpus di GATTO è possibile trattare differentemente sia le parole che includono un apice che quelle che contengono un punto in alto. Ad esempio la stringa ch'elli può essere memorizzata come la singola forma ch'elli o come la coppia di forme ch' e elli; lo stesso vale ad esempio per co·llui, memorizzabile come co·llui o come co· e llui. Si ottengono questi risultati semplicemente inserendo nei testi opportune codifiche. Quando si effettua una ricerca a partire da un brano di testo tratto da una fonte qualunque e quindi privo di marcatori che chiariscano questo tipo di situazioni, si possono effettuare questi discrimini utilizzando l'opzione spezza dopo diacritico. Per la precisione:

Un altro effetto dell'opzione spezza dopo diacritico riguarda il trattamento del punto: il punto immediatamente successivo a dei caratteri costituenti una parola è considerato punto di abbreviazione se l'opzione spezza dopo diacritico è attiva, è considerato invece interpunzione se l'opzione è disattivata.


L'opzione spezza dopo diacritico presenta l'intrinseca limitazione di applicare lo stesso trattamento a tutte le parole presenti nel brano di partenza. Per risolvere i problemi che ne potrebbero derivare è possibile inserire nel testo, anche ripetutamente, il carattere @ che inverte temporaneamente, ovvero solo per la parola che lo segue, lo stato dell'opzione spezza dopo diacritico; al termine della parola successiva al carattere @ lo stato iniziale dell'opzione spezza dopo diacritico viene automaticamente ripristinato.

Per chiarire con un esempio il comportamento di questa opzione, nella pagina di impostazione di una ricerca per forme da brano inserire nel pannello la stringa seguente (notare il punto di abbreviazione dopo fio e di interpunzione dopo casa):

andà'lo casa. dara'li,dara'line;falla·i fio. po po·lo

Eseguire una prima ricerca con l'opzione spezza dopo diacritico disattivata: si potranno trovare (se presenti nel corpus) occorrenze delle forme andà'lo, casa, dara'li, dara'line, falla·i, po, po·lo, ovvero di tutte le 8 forme digitate, considerate intere, con esclusione di fio.: per quest'ultima, poiché il punto è stato assunto essere un segno di interpunzione la parola effettivamente cercata è stata fio.

Ripetere ora la stessa ricerca attivando l'opzione spezza dopo diacritico. Il risultato è ora molto diverso e si possono trovate occorrenze delle forme dara', fio., i, li, line, lo, po. In particolare, questa volta vengono localizzate come forme distinte le parti che precedono e seguono i diacritici apice e punto in alto. Si può trovare fio., mentre non verrà mai localizzata casa in quanto la forma cercata è stata casa., includente un punto di abbreviazione.

Come ultima prova includere un carattere @ prima di casa e ripetere l'ultima ricerca, ovvero mantenendo attiva l'opzione spezza dopo diacritico: la stringa da cercare diviene allora (@ può essere a contatto o meno con la parola che lo segue):

andà'lo @ casa. dara'li,dara'line;falla·i fio. po po·lo

Il risultato questa volta è pressoché identico al precedente, salvo che viene localizzata anche la forma casa poiché è stato detto al programma di applicare, solo per essa, le convenzioni valide quando lo stato di spezza dopo diacritico è invertito rispetto all'impostazione del check box: ciò ha significato in questo caso cercare casa considerando l'opzione disattivata e quindi assumendo che il punto fosse un segno di interpunzione non appartenente alla forma.

Sempre in relazione alla pagina di impostazione di ricerche per forme da un brano, tenere presente che eventuali segni diacritici isolati o sequenze di soli segni diacritici, come potrebbe essere ·' (punto in alto più apice), vengono rimossi e quindi non considerati ai fini della ricerca.




Vai all'indice
Vai alla pagina precedente Vai a inizio capitolo Vai alla pagina successiva