Oltre agli operatori descritti nella sezione di ricerca avanzata, DocGoblin ti permette anche di usare caratteri jolly ed espressioni regolari per creare pattern di ricerca più flessibili.

Caratteri jolly

I caratteri jolly sono caratteri speciali che sostituiscono uno o più caratteri in una parola. I due caratteri jolly disponibili sono ? e *.

Il carattere jolly ? sostituisce un singolo carattere. Ad esempio, la ricerca te?to troverà testo, texto e qualsiasi altra parola di cinque lettere che inizia con te e finisce con to.

Il carattere jolly * sostituisce zero o più caratteri. Ad esempio, la ricerca test* troverà test, tests, testing e qualsiasi altra parola che inizia con test.

Puoi combinare entrambi i caratteri jolly in una singola ricerca. Ad esempio, la ricerca t?st* troverà test, testing, tastes e qualsiasi altra parola che corrisponde a questo pattern.

Espressioni regolari

Le espressioni regolari (regex) sono un modo potente per descrivere pattern di testo. DocGoblin supporta un sottoinsieme della sintassi regex attraverso Apache Lucene.

Per usare una regex nella tua ricerca, inserisci il pattern tra barre oblique: /pattern/. Le sezioni seguenti descrivono i costrutti regex più utili.

Qualsiasi carattere

Il punto . corrisponde a qualsiasi singolo carattere. È l'equivalente regex del carattere jolly ?.

Esempi:

Una o più occorrenze

Il segno più + corrisponde a una o più occorrenze del carattere precedente.

Esempio (corrisponde a der, deer, deeer, ecc.):

Zero o più occorrenze

L'asterisco * corrisponde a zero o più occorrenze del carattere precedente.

Esempio (corrisponde a wd, wed, weed, ecc.):

Zero o una occorrenza

Il punto interrogativo ? corrisponde a zero o una occorrenza del carattere precedente, rendendolo opzionale.

Esempio (corrisponde a wed e weed):

Occorrenze minime e massime

Le parentesi graffe {} ti permettono di specificare un numero esatto o un intervallo di occorrenze del carattere precedente:

Esempi:

Raggruppamento

Le parentesi tonde () ti permettono di raggruppare caratteri insieme in modo che i quantificatori si applichino all'intero gruppo piuttosto che a un singolo carattere.

Esempi:

Alternanza

La barra verticale | corrisponde all'espressione alla sua sinistra o all'espressione alla sua destra. Viene tipicamente usata all'interno di un gruppo.

Esempio (corrisponde a preparations e proportions):

Classi di caratteri

Le classi di caratteri ti permettono di corrispondere a un singolo carattere da un insieme di caratteri.

Definisci una classe di caratteri inserendo i caratteri accettati tra parentesi quadre []. Puoi anche specificare un intervallo di caratteri usando un trattino -.

Forme disponibili:

Come mostrato sopra, il simbolo caret ^ all'inizio di una classe di caratteri la nega, corrispondendo a qualsiasi carattere non presente nell'insieme.

Le classi di caratteri possono essere combinate con tutti gli altri costrutti regex per costruire pattern di ricerca complessi.

Per recuperare la stringa "weed", si potrebbe usare la seguente espressione:

Approfondisci

DocGoblin usa il motore regex di Apache Lucene. Per il riferimento completo alla sintassi, consulta la documentazione ufficiale di Lucene.

Se vuoi sperimentare con le regex in un ambiente sandbox, prova regex101.com, un tester di regex online gratuito.