next up previous contents index
Next: Kostenfunktionen Up: Algorithmen für multiples Alignment Previous: Algorithmen für multiples Alignment

Definition

Definition 12     Sei $\Sigma$ ein endliches Alphabet ohne das Leerzeichen '-' und $\Sigma'=\Sigma\cup \{'-'\}$. Seien weiter $S_1,\ldots,S_k$ k Sequenzen über $\Sigma$ mit Längen $n_1,\ldots,n_k$. Ein (globales) multiples Alignment A von $S_1,\ldots,S_k$ ist eine Matrix der Dimension $k\times l$ mit den folgenden Eigenschaften:

Beispiel 8    
         S1 = - G C T G A T A T A G C T
         S2 = G G G T G A T - T A G C T
         S3 = - G C T - A T - - C G C -
         S4 = A G C G G A - A C A C C T

In der Folge werden wir von (multiplen) Alignments von Untermengen der k Strings reden. Dazu führen wir noch folgende Notation ein.

Definition 13   Sei A eine multiples Alignment für die k Strings $S_1,\ldots,S_k$ und $I\subseteq \{1,\ldots,k\}$ eine Menge von Indizes, welche eine Untermenge der k Strings definiert. Sei AI das Alignment, welches man erhält, indem man alle Reihen $i\in I$ aus A nimmt und dann alle Spalten löscht, welche nur aus Leerzeichen bestehen. Dann nennt man AI die Projektion von A auf I. Wenn die Menge I explizit angegeben wird, vereinfachen wir die Notation und schreiben statt $A_{\{i,j,k\}}$ vereinfacht Ai,j,k

Beispiel 9    
         S1 = - G C T G A T A T A G C T
         S2 = G G G T G A T - T A G C T
         S3 = - G C T - A T - - C G C -
         S4 = A G C G G A - A C A C C T
Die Projektion A2,3 erhält man, indem man die zweite und dritte Reihe des Alignments nimmt:
         S2 = G G G T G A T - T A G C T
         S3 = - G C T - A T - - C G C -
und dann die Spalte, welche nur aus Leerzeichen besteht löscht:
         S2 = G G G T G A T T A G C T
         S3 = - G C T - A T - C G C -


next up previous contents index
Next: Kostenfunktionen Up: Algorithmen für multiples Alignment Previous: Algorithmen für multiples Alignment
Knut Reinert
1998-03-09