lokalen Kontextraum für einzelne Objekte. Da die Lösung der
Interpretation mit MRF grundsätzlich darin besteht, eine
globale Energie zu minimieren, welche als Summe über den
gesamten Graphen gebildet wird, und die Eigenschaften (und
damit auch die Energie) an einem Einzelknoten weitgehend von
den Eigenschaften der Nachbarn dieses Knotens abhängen,
Bild 1
1
Rot
Grün
e
A
00 :::;000037—+4 0
Abbildung 1: Ein- und Ausgabedaten von FAST Vision
berücksichtigt man gleichzeitig den lokalen und globalen
Kontext.
Am Beispiel der Bildinterpretation soll nun die Theorie der
MRF in Anlehnung an [Modestino/Zhang, 1992] etwas genauer
dargestellt werden: Ausgehend von einem Graphen G = {R, E}
mit der Knotenmenge R = {R,, R,, ..., Ry}, wobei jeder Knoten
cinem Bildsegment entspreche, und der Menge der diese
Knoten verbindenden Kanten E, wobei lediglich räumlich
benachbarte Knoten durch Kanten verbunden sind, läßt sich ein
Nachbarschaftssystem n = {n(Rı), n(R,), ..., n(Ry)}definieren,
wobei n(Rj, i — 1, 2, ..., N, die Menge aller Knoten in R ist.
Dabei ist R; ¢n(R;) und wenn R; e n(R;) dann gilt R; € nR)).
Assoziiert man mit jedem Knoten R; aus R eine (symbolische)
Zufallsvariable I;, so bezeichnet man die Menge I = {I,, L, ..
Ly} als Zufallsfeld.
Fir Markov-Zufallsfelder miissen daneben noch folgende
Eigenschaften erfiillt sein:
1.) P[J] > 0 für alle Realisierungen von I
2.) P[I]L, für alle R; wobei j # i] = P[L|L, für alle j wobei R; €
n(R;)]
Der zweite Punkt bringt dabei zum Ausdruck, daB die
statistischen Eigenschaften an einem bestimmten Knoten im
wesentlichen nur von den Eigenschaften der Nachbarknoten
abhängen.
Eine wichtige Eigenschft von Markov Zufallsfeldern ist die,
daß ihre Wahrscheinlichkeitsdichte identisch ist mit der Gibbs-
Verteilung. Die Theorie der Gibbs-Felder benutzt dem Begriff
der Clique, welche eine Untermenge eines Graphen darstellt,
wobei in dieser Untermenge jeder Knoten mit allen anderen
Knoten durch Kanten verbunden ist.
Bezeichnet man die Menge aller Cliquen in G bezüglich des
Nachbarschaftssystems n mit C(G,n), so hat die Wahr-
scheinlichkeitsdichte folgende Gibbs-Verteilung:
2
P[I] 7? Z 'exp[-U(4)]
966
International Archives of Photogrammetry and Remote Sensing. Vol. XXXI, Part B3. Vienna 1996
wobei
Dr
ceC(G,n)
auch als Energie-Funktion bezeichnet wird und Z lediglich
einen Normierungsfaktor darstellt. Die "V, werden im
allgemeinen als Cliquenfunktionen bezeichnet und können
beliebiger Art sein solange man beachtet, daß sie lediglich von
den Knoten der jeweiligen Clique abhängen. Mit Hilfe der
Cliquenfunktion wird letzlich das Verhalten des Markov-
Zufallsfeldes gesteuert, durch geeignete Wahl der
Cliquenfunktion lassen sich Regeln, Vorwissen und Messwerte
mit Hilfe der MRF modellieren.
Als wesentlicher Grundgedanke ist zu beachten, daß die
Energie, also der Funktionswert einer Cliquenfunktion hoch
sein soll, wenn die Wahrscheinlichkeit der Zuordnung gering
istund der Funktionswert klein sein soll, wenn die
Zuordnungen an den Knoten sowohl mit den Messwerten als
auch mit dem Vorwissen konsistent sind. Mit dieser Grundregel
können beliebige Cliquenfunktionen erstellt werden.
Das Problem der Bildinterpretation kann mit Hilfe von Markov-
Zufallsfeldern als Optimierungsproblem angesehen werden: Für
ein gegebenes R wird ein Maximales F,(R) gesucht, wobei dies
dann erreicht wird, wenn die gewählten Zuordnungungen an
den Knoten des Zufallsfeldes sowohl mit den Messungen als
auch mit dem Vorwissen bestmóglich konsistent sind.
2.2. Objektoberflächenrekonstruktion (Facetten-
Stereosehen)
Das Programmsystem Facetten-Stereosehen (FAST Vision) ist
ein objektraumorientiertes Rekonstruktionsverfahren, welches
auf einem Finite-Elemente-Ansatz sowohl der Objektoberfläche
(DOM) als auch der Objektdichten (Orthophoto) beruht. Mit
Hilfe diese Programms lassen sich gleichzeitig hochaufgelôste
DOM und Orthophotos aus (Luft-)Bildern ableiten.
Durch den objektraumorientierten Ansatz ist es insbesondere
relativ einfach môglich, zusätzliche Bedingungen einzuführen.
Neben Regularisierungsfunktionen können dies insbesondere
geometrische Bedingungen wie beispielsweise die Einführung
von Bruch- oder Objektkanten als Bearbeitungsgrenzen sein,
wodurch letzlich die Finiten-Elemente optimal an die gegebene
Situation (Objektoberfläche) angepasst werden können und
somit eine maximale Genauigkeit erreicht werden kann.
Als finite Elemente werden üblicherweise quadratische
Bilinearflächen verwendet (=Facetten), andere Oberflächen-
repräsentationen sind jedoch ebenfalls möglich, z.B.
orthogonale Wavelets [Tsay et al., 1996]. Abbildung 1 soll den
grundsätzlichen Ansatz von FAST Vision verdeutlichen,
weitergehende Literatur findet sich in [Wrobel, 1987], [Tsay,
1996].
2.3. Testdatensatz
Als Testdatensatz wurden 3 Farbinfrarot-Luftbilder im Maßstab
1 : 6 000 ausgewählt und mit einer Auflösung von 15 um in
allen 3 Farbkanälen gescannt. Abbildung 2 zeigt den
Stereobereich dieser Luftbilder. Der Bildinhalt kann als typisch
für ländlich geprägtes Gebiet angesehen werden. Man kann den
Bildinhalt grob in 3 Gebiete unterteilen: Ortslage (ca. 20% der
Fläche), landwirtschaftlich genutzte Flächen (ca. 45%) und
forstwirtschaftlich genutzte Flächen (ca. 35%).
m^ C (nh — m oM CS C AR A DEE AS A 71