next up previous contents index
Next: Profile Alignment Up: Kostenfunktionen Previous: Alignment entlang eines Baumes

Consensus Alignment

Sei A[][i] eine beliebige Spalte eines multiplen Alignments A. Dann heißt derjenige Buchstabe xi der i-te consensus-Buchstabe,   für den der consensus-Fehler  ( $\sum_{i=1}^k d(x_i,A[][i])$) minimal ist. Die Konkatenierung der consensus-Buchstaben ergibt dann den sogenannten consensus-String . Man versucht also, das Alignment A* zu finden, welche über alle Spalten summiert, den consensus-Fehler minimiert. c(A) wird wie folgt definiert:

\begin{displaymath}c(A)=\sum_{i=1}^{l} d(x_i,A[][i]) \ \quad x_i \mbox{ ist der $i$ -te
consensus Buchstabe} \end{displaymath}

Beispiel 12   Sei d(A,B)=2 für $A\neq B$, d(A,-)=d(-,A)=1 für $A\neq '-'$, 0 sonst.
              S1 = - G C T G A T A T A A C T
              S2 = G G G T G A T - T A G C T
              S3 = A G C G G A - A C A C C T
                   -------------------------
Consensus  :       - G C T G A T A T A X C T
Spaltenwert:       2 0 2 2 0 0 1 1 2 0 4 0 0 = 14
Ein X im consensus String symbolisiert, daß jeder Buchstabe der consensus Buchstabe sein kann.



Knut Reinert
1998-03-09