Bisher beschäftigten wir uns nur mit Alignments, in deren Zielfunktionen wir
Matches, Mismatches und Indels betrachteten. In der Praxis
werden diese Alignments kaum benutzt, hier erweitert man das Alignment-Modell
um gaps.
Definition 2
Ein gap ist ein maximaler Substring
für X=A oder
X=B in einem
Alignment von A und B, welcher nur aus Leerzeichen besteht, d.h.
x'k = '-', für
.
Gaps erlauben uns, Alignments zu berechnen, welche besser den zugrundeliegenden
biologischen Modellen entsprechen. Wir definieren nun eine neue Rekursion für
globales Ähnlichkeitsalignment mit gaps, wobei g(k)>0 die Kosten eines Gaps
der Länge k angeben:
Satz 5
Sei
S0,0 = 0,
S0,j = -g(j),
Si,0 = -g(i).
Dann gilt:
Si,j
Si-1,j-1+s(ai,bj),
Der Wert eines optimalen globalen Alignments ist Sn,m.