Grundlagen

Alphabet, Wort, Sprache

 aufwärts

Alphabet

Definition:  Ein Alphabet ist eine endliche, nichtleere Menge von Zeichen (Symbolen). Ein geordnetes Alphabet ist ein Alphabet, dessen Zeichen gemäß einer Ordungs­relation angeordnet sind.

 

Wort

Definition:  Sei A ein Alphabet. Ein Wort (eine Zeichenreihe) w über A ist eine endliche Folge

w  =  w0 ... wn-1     mit  wi Element A,   n Element natürliche Zahlen0.

|w| = n   ist die Länge des Wortes w.

Beispiel:  A = {a, ..., z} ,   w = esel     d.h.   w0 = e,  w1 = s,  w2 = e,  w3 = l     und |w| = 4.

Das Wort der Länge 0 bezeichnen wir mit ε, es wird das leere Wort (die leere Zeichenreihe) genannt; d.h. |ε| = 0. Wir identifizieren ferner das Alphabet A mit der Menge der Wörter der Länge 1 über A.

Definition:  Die Menge aller Wörter über einem Alphabet A wird mit A* bezeichnet:

A*   =  { w  |  w = w0 ... wn-1wi Element An Element natürliche Zahlen0}.

Die Menge aller nichtleeren Wörter über A wird mit A+ bezeichnet:

A+   =  { w  |  w = w0 ... wn-1wi Element An Element natürliche Zahlen}   =  A* \ {ε}.

Satz:  |A*|  = hebräisches aleph0,   d.h. es gibt abzählbar unendlich viele Wörter über A.

Definition:  Seien  x = x0 ... xn-1  und  y = y0 ... ym-1  Wörter über einem Alphabet A. Die Verkettung  xy  von  x  und  y  ist definiert als das Wort

xy   =  x0 ... xn-1 y0 ... ym-1,

d.h.   (xy)i  =  xi   falls  i Element {0, ..., n-1}   bzw.   yi-n sonst.

Beispiel:  x = bro ,   y = esel ,   xy = broesel

εx = xε = x   für alle Wörter x

Die Verkettung ist eine assoziative Operation auf der Menge A*. Mit dem leeren Wort ε als neutralem Element bildet A* ein Monoid.

Definition:  Die i-te Potenz eines Wortes x ist definiert durch:

x0  = ε,

xi  = xi-1x   für alle  i Element natürliche Zahlen.

 

Sprache

Definition:  Sei A ein Alphabet. Eine Teilmenge L enthalten A* heißt formale Sprache oder kurz Sprache über A. Eine Sprache ist also eine beliebige Menge von gewissen Wörtern über A.

Beispiel:  Es sei A = {a, b, c}. Dann sind beispielsweise folgende Mengen Sprachen über A:

L1  =   {aa, ab, aabcaacb}

L2  =  {ε}

L3  =  leere Menge

L4  =  { anbncn  |  n Element natürliche Zahlen0}

L5  =  A* \ {abc}

Definition:  Seien X und Y Sprachen, d.h. Mengen von Wörtern über A. Die Verkettung (oder das Produkt) der Sprachen X und Y ist die Sprache

XY   =  { xy  |  x Element Xy Element Y }.

Beispiel:  Seien X = {a, le},   Y = {ber, bend}. Dann ist XY = {aber, abend, leber, lebend}.

Für alle Sprachen X gilt

{ε}X  =  X{ε}  =  X ,

aber

leere MengeX  =  Xleere Menge  =  leere Menge.

Definition:  Die i-te Potenz einer Sprache X ist definiert durch:

X 0  = {ε},

X i  = X i-1X   für alle  i Element natürliche Zahlen.

Definition:  Der Abschluss X* einer Sprache X ist definiert durch:

X*   =   Vereinigung i Element IN0   X i   =  {ε}   vereinigt   X   vereinigt   X 2   vereinigt  ...

Bemerkung:  Fasst man das Alphabet A als Menge von Wörtern der Länge 1 auf und bildet den Abschluss A*, so erhält man die Menge aller Wörter über A, also A* aus der ursprünglichen Definition.

Satz:  Sei L eine Sprache über A. Dann ist L entweder endlich oder abzählbar unendlich.

Definition:  Sei A ein Alphabet. Die Menge aller Sprachen über A ist

kalligraphisches LA  =  { L  |  L enthalten A*}  =  Potenzmenge(A*).

Satz:  Es gilt:  |kalligraphisches LA| = Mächtigkeit des Kontinuums,   d.h. es gibt überabzählbar viele Sprachen über A.

 

 

Weiter mit:   [Literatur]   oder up del.icio.us digg.com Google Ma.gnolia Mister Wong StumbleUpon YahooMyWeb LinkARENA

 

homeH.W. Lang   FH Flensburg   lang@fh-flensburg.de   Impressum   ©   Created: 09.12.1997   Updated: 11.01.2010
Valid HTML 4.01 Transitional