Zusätzlich zu den im Abschnitt „Erweiterte Suche“ beschriebenen Operatoren ermöglicht DocGoblin auch die Verwendung von Platzhaltern und regulären Ausdrücken, um flexiblere Suchmuster zu erstellen.

Platzhalter

Platzhalter sind Sonderzeichen, die ein oder mehrere Zeichen in einem Wort ersetzen. Die beiden verfügbaren Platzhalter sind ? und *.

Der Platzhalter ? ersetzt ein einzelnes Zeichen. Beispielsweise findet die Suche te?t test, text und jedes andere vierbuchstabige Wort, das mit te beginnt und mit t endet.

Der Platzhalter * ersetzt null oder mehr Zeichen. Beispielsweise findet die Suche test* test, tests, testing und jedes andere Wort, das mit test beginnt.

Sie können beide Platzhalter in einer einzigen Suche kombinieren. Beispielsweise findet die Suche t?st* test, testing, tastes und jedes andere Wort, das diesem Muster entspricht.

Reguläre Ausdrücke

Reguläre Ausdrücke (Regex) sind eine leistungsstarke Möglichkeit, Textmuster zu beschreiben. DocGoblin unterstützt über Apache Lucene eine Teilmenge der Regex-Syntax.

Um ein Regex in Ihrer Suche zu verwenden, setzen Sie das Muster zwischen Schrägstriche: /pattern/. Die folgenden Abschnitte beschreiben die nützlichsten Regex-Konstrukte.

Beliebiges Zeichen

Der Punkt . entspricht jedem einzelnen Zeichen. Er ist das Regex-Äquivalent zum Platzhalter ?.

Beispiele:

Ein oder mehrere Vorkommen

Das Pluszeichen + entspricht einem oder mehreren Vorkommen des vorangehenden Zeichens.

Beispiel (findet der, deer, deeer usw.):

Null oder mehr Vorkommen

Das Sternchen * entspricht null oder mehr Vorkommen des vorangehenden Zeichens.

Beispiel (findet wd, wed, weed usw.):

Null oder ein Vorkommen

Das Fragezeichen ? entspricht null oder einem Vorkommen des vorangehenden Zeichens und macht es optional.

Beispiel (findet wed und weed):

Minimale und maximale Vorkommen

Mit geschweiften Klammern {} können Sie eine genaue Anzahl oder einen Bereich von Vorkommen des vorangehenden Zeichens angeben:

Beispiele:

Gruppierung

Mit runden Klammern () können Sie Zeichen gruppieren, sodass Quantoren auf die gesamte Gruppe statt auf ein einzelnes Zeichen angewendet werden.

Beispiele:

Alternation

Der senkrechte Strich | entspricht entweder dem Ausdruck links oder dem Ausdruck rechts davon. Er wird typischerweise innerhalb einer Gruppe verwendet.

Beispiel (findet preparations und proportions):

Zeichenklassen

Mit Zeichenklassen können Sie ein einzelnes Zeichen aus einer Menge von Zeichen abgleichen.

Sie definieren eine Zeichenklasse, indem Sie die akzeptierten Zeichen in eckige Klammern [] setzen. Sie können auch einen Zeichenbereich mit einem Bindestrich - angeben.

Verfügbare Formen:

Wie oben gezeigt, negiert das Zirkumflex ^ am Anfang einer Zeichenklasse diese und findet jedes Zeichen, das nicht in der Menge enthalten ist.

Zeichenklassen können mit allen anderen Regex-Konstrukten kombiniert werden, um komplexe Suchmuster zu erstellen.

Um die Zeichenfolge „weed“ zu finden, könnte der folgende Ausdruck verwendet werden:

Mehr erfahren

DocGoblin verwendet die Regex-Engine von Apache Lucene. Die vollständige Syntax-Referenz finden Sie in der offiziellen Lucene-Dokumentation.

Wenn Sie mit regulären Ausdrücken in einer Sandbox-Umgebung experimentieren möchten, probieren Sie regex101.com, einen kostenlosen Online-Regex-Tester.