GrundlagenAlphabet, Wort, Sprache | |
Definition: Ein Alphabet ist eine endliche, nichtleere Menge von Zeichen (Symbolen). Ein geordnetes Alphabet ist ein Alphabet, dessen Zeichen gemäß einer Ordungsrelation angeordnet sind.
Definition: Sei A ein Alphabet. Ein Wort (eine Zeichenreihe) w über A ist eine endliche Folge
w = w0 ... wn-1 mit wi
A, n
0.
|w| = n ist die Länge des Wortes w.
Beispiel: A = {a, ..., z} , w = esel d.h. w0 = e, w1 = s, w2 = e, w3 = l und |w| = 4.
Das Wort der Länge 0 bezeichnen wir mit ε, es wird das leere Wort (die leere Zeichenreihe) genannt; d.h. |ε| = 0. Wir identifizieren ferner das Alphabet A mit der Menge der Wörter der Länge 1 über A.
Definition: Die Menge aller Wörter über einem Alphabet A wird mit A* bezeichnet:
A* = { w | w = w0 ... wn-1 , wi
A, n
0}.
Die Menge aller nichtleeren Wörter über A wird mit A+ bezeichnet:
A+ = { w | w = w0 ... wn-1 , wi
A, n
} = A* \ {ε}.
Satz: |A*| =
0, d.h. es gibt abzählbar unendlich viele Wörter über A.
Definition: Seien x = x0 ... xn-1 und y = y0 ... ym-1 Wörter über einem Alphabet A. Die Verkettung xy von x und y ist definiert als das Wort
xy = x0 ... xn-1 y0 ... ym-1,
d.h. (xy)i = xi falls i
{0, ..., n-1} bzw. yi-n sonst.
Beispiel: x = bro , y = esel , xy = broesel
εx = xε = x für alle Wörter x
Die Verkettung ist eine assoziative Operation auf der Menge A*. Mit dem leeren Wort ε als neutralem Element bildet A* ein Monoid.
Definition: Die i-te Potenz eines Wortes x ist definiert durch:
x0 = ε,
xi = xi-1x für alle i
.
Definition: Sei A ein Alphabet. Eine Teilmenge L
A* heißt formale Sprache oder kurz Sprache über A. Eine Sprache ist also eine beliebige Menge von gewissen Wörtern über A.
Beispiel: Es sei A = {a, b, c}. Dann sind beispielsweise folgende Mengen Sprachen über A:
L1 = {aa, ab, aabcaacb}
L2 = {ε}
L3 =
L4 = { anbncn | n
0}
L5 = A* \ {abc}
Definition: Seien X und Y Sprachen, d.h. Mengen von Wörtern über A. Die Verkettung (oder das Produkt) der Sprachen X und Y ist die Sprache
XY = { xy | x
X, y
Y }.
Beispiel: Seien X = {a, le}, Y = {ber, bend}. Dann ist XY = {aber, abend, leber, lebend}.
Für alle Sprachen X gilt
{ε}X = X{ε} = X ,
aber
X = X
=
.
Definition: Die i-te Potenz einer Sprache X ist definiert durch:
X 0 = {ε},
X i = X i-1X für alle i
.
Definition: Der Abschluss X* einer Sprache X ist definiert durch:
X* =
i
IN0 X i = {ε}
X
X 2
...
Bemerkung: Fasst man das Alphabet A als Menge von Wörtern der Länge 1 auf und bildet den Abschluss A*, so erhält man die Menge aller Wörter über A, also A* aus der ursprünglichen Definition.
Satz: Sei L eine Sprache über A. Dann ist L entweder endlich oder abzählbar unendlich.
Definition: Sei A ein Alphabet. Die Menge aller Sprachen über A ist
A = { L | L
A*} =
(A*).
Satz: Es gilt: |
A| =
, d.h. es gibt überabzählbar viele Sprachen über A.
Weiter mit: [Literatur] oder ![]() |
|
|
|