Reguläre Ausdrücke

<< Zum Inhaltsverzeichnis >>

Navigation:  UltraSearch > Tipps & Anmerkungen >

Reguläre Ausdrücke

Logo

Reguläre Ausdrücke beschreiben Muster in Zeichenketten und werden u.a. dazu benutzt, um festzustellen, ob in einem Text, dem Suchtext, ein vorgegebenes Zeichenmuster vorkommt oder nicht. In UltraSearch können reguläre Ausdrücke dazu benutzt werden, bestimmte Dateien und/oder Ordner zu finden, die den entsprechenden Kriterien entsprechen.

 

Die folgende Tabelle beinhaltet einen Teil der häufig verwendeten Syntax mit einigen Beispiele:

Ausdruck

Syntax

Beschreibung

Beispiel

Beliebiges Zeichen

.

Entspricht einem beliebigen Zeichen mit Ausnahme des Zeilenumbruchs.

a.o findet "aro" in "around" und "abo" in "about", jedoch nicht "acro" in "across".

0 (null) oder mehr

*

Findet 0 (null) oder mehr Vorkommen des vorangehenden Ausdrucks und ergibt somit alle möglichen Übereinstimmungen.

*b findet "b" in "bat" und "ab" in "about".

e.*e findet das Wort "enterprise".

Eine oder mehr

+

Findet mindestens ein Vorkommen des vorhergehenden Ausdrucks.

ac+ findet Wörter mit dem Buchstaben "a" und mindestens einer Instanz von "c", z. B. "race" und "ace".

a.+s findet das Wort "access".

Anfang der Zeichenfolge

^

Entspricht dem Anfang einer Zeichenfolge

^[0-9] findet Zeichenketten, die mit einer Ziffer beginnen

Ende der Zeichenfolge

$

Entspricht dem Ende einer Zeichenfolge

exe$ findet Zeichenketten, die mit "exe" enden.

Wortanfang

[[:<:]]

Findet nur dann eine Übereinstimmung, wenn das Wort an dieser Textstelle beginnt.

[[:<:]]in findet Wörter wie "inside" und "into", die mit den Buchstaben "in" anfangen.

Wortende

[[:>:]]

Gibt eine Übereinstimmung nur zurück, wenn das Wort an dieser Textstelle endet.

ss[[:>:]] findet Wörter wie "across" und "loss", die mit den Buchstaben "ss" enden.

Ein beliebiges Zeichen in der Menge

[]

Findet eines der Zeichen, die in [] enthalten sind. Geben Sie zum Festlegen eines Bereichs von Zeichen das Start- und das Endzeichen durch einen Bindestrich (-) getrennt ein, wie in [a-z].

be[n-t] findet "bet" in "between", "ben" in "beneath" und "bes" in "beside", jedoch nicht "bel" in "below".

Ein beliebiges, nicht in der Menge enthaltenes Zeichen

[^...]

Findet ein beliebiges Zeichen, das nicht im Satz von Zeichen nach ^ enthalten ist.

be[^n-t] findet "bef" in "before", "beh" in "behind" und "bel" in "below", jedoch nicht "ben" in "beneath".

Oder

|

Findet entweder den Ausdruck vor oder nach dem Symbol Oder (|). Wird meistens in einer Gruppe verwendet.

(sponge|mud) bath findet "sponge bath" und "mud bath".

Escape

\

Findet das Zeichen, das dem umgekehrten Schrägstrich (\) als Literal folgt. Damit können Sie Zeichen wie { und ^ suchen, die in der Notation für reguläre Ausdrücke verwendet werden.

\^ sucht nach dem Zeichen ^.

n Mal wiederholen.

{n}

Entspricht n Instanzen des vorhergehenden Ausdrucks.

[0-9]{4} findet alle Zeichenfolgen mit 4 Ziffern.

Gruppierung

()

Ermöglicht es Ihnen, einen Satz von Ausdrücken zu gruppieren. Wenn Sie in einer Suche nach zwei verschiedenen Ausdrücken suchen möchten, können Sie diese mit dem Gruppierungsausdruck kombinieren.

Wenn Sie nach [a-z][1-3] oder [1-10][a-z] suchen möchten, würden Sie diese Ausdrücke wie folgt kombinieren: ([a-z][1-3])|([1-10][a-z]).

 

Weitere Beispiele:

Regulärer Ausdruck

Anwendungszweck

[0-9] oder \d

Findet alle Dateien/Ordner, die mindesten eine Ziffer im Namen enthalten.

a|b

Findet alle Dateien/Ordner, die "a" oder "b" im Namen enthalten.

[^(A-Za-z)]

Findet alle Dateien/Ordner, die mindestens ein Zeichen enthalten, das kein Buchstabe ist.

^E[0-9]{7}$

Findet alle Dateien/Ordner, die mit einem "E" beginnen an das sich genau sieben Ziffern anschließen.

[A-Za-z]:\\([^\\]+\\){2,4}[^\\]+$

Findet alle Dateien/Ordner mit einer Verzeichnistiefe von mindestens 2 und höchstens 4.

[^\x00-\x7F]

Findet alle Dateien/Ordner mit ungültigen ASCII-Zeichen (nur 7Bit ASCII erlaubt).

[^\P{C}]

Findet alle Dateien/Ordner mit nicht-druckbaren Unicode-Zeichen.

[\xA0]

Findet alle Dateien/Ordner mit dem non-breakable-Space Zeichen (Unicode NOBR, U+00A0)

[~\"#%&\*\:<>\?\/\\{|}]

Findet alle Dateien und Ordner, die in ihrem Namen Zeichen enthalten, die auf einem SharePoint Server nicht erlaubt sind.

^\s+.*

Findet alle Dateien/Ordner, die mit einem Leerzeichen anfangen.

\s+(\.[^.]+)$

Findet alle Dateien mit Dateiendung, deren Name mit einem Leerzeichen endet.

.*\s+$

Findet alle Ordner, deren Name mit einem Leerzeichen endet.

 

Mehr Informationen zu regulären Ausdrücken (mit Beispielen) finden Sie hier.

Eine Liste spezieller Zeichen, die innerhalb regulärer Ausdrücke benutzt werden können, finden Sie hier.

 

Zur weiteren Hilfe beim Bilden regulärer Ausdrücke können folgende Tools verwendet werden:

https://regex101.com/ (online)

http://regexpal.com/ (online)

http://sourceforge.net/projects/regexpeditor/ (download)

http://sourceforge.net/projects/regextester/ (download)

http://sourceforge.net/projects/regaxe/ (download)