Convolution-Filter: Unterschied zwischen den Versionen
K (→Ein klein wenig Theorie: Kleinigkeiten) |
(Beispielcode hinzugefügt (sollte funktionieren, ein Test kann aber nicht schaden)) |
||
Zeile 25: | Zeile 25: | ||
so addiert man durch die Faltung an einer Stelle x des Bildes f mit g, auch alle direkt benachbarten Bildpunkte auf und blendet sie so zusammen - dabei verschwinden die Details im Bild (Details haben in der Signalverarbeitung eine hohe Frequenz) und es bleiben nur die Informationen, die sich lokal um unseren Bildpunkt nicht so sehr ändern (also eine niedrige Frequenz haben); g unterdrückt also hohen Frequenzen und lässt die niedrigen durch - weshalb g ein Tiefpass-Filter genannt wird. | so addiert man durch die Faltung an einer Stelle x des Bildes f mit g, auch alle direkt benachbarten Bildpunkte auf und blendet sie so zusammen - dabei verschwinden die Details im Bild (Details haben in der Signalverarbeitung eine hohe Frequenz) und es bleiben nur die Informationen, die sich lokal um unseren Bildpunkt nicht so sehr ändern (also eine niedrige Frequenz haben); g unterdrückt also hohen Frequenzen und lässt die niedrigen durch - weshalb g ein Tiefpass-Filter genannt wird. | ||
Andererseits erkennt man, daß der Faltungskern g beschreibt, mit welchen Faktoren benachbarte Bildpunkte im Ergebnis zusammengeblendet werden. Der Bereich in dem g gleich 0 ist, ist damit aber völlig unerheblich und man beschränkt sich zum Speichern des Kerns auf dessen Support, was zu den bereits erwähnten Darstellungen mit Matrizen führt. | Andererseits erkennt man, daß der Faltungskern g beschreibt, mit welchen Faktoren benachbarte Bildpunkte im Ergebnis zusammengeblendet werden. Der Bereich in dem g gleich 0 ist, ist damit aber völlig unerheblich und man beschränkt sich zum Speichern des Kerns auf dessen Support, was zu den bereits erwähnten Darstellungen mit Matrizen führt. | ||
+ | |||
+ | == Faltungskerne und OpenGL == | ||
+ | Um solche Kerne in OpenGL zu verwenden, gibt es die Funktionen um [[glConvolutionFilter]]. Für eine genauere Referenz der Parameter sollte man sich am besten den Funktionsartikel anschauen. Um einen Gaussischen Blur zu implementieren, ist folgender Code angemessen: | ||
+ | <pascal> | ||
+ | const | ||
+ | GaussMatrix: array [0..8] of array [0..8] of Single = ( | ||
+ | ( 1/1600, 2/1600, 4/1600, 8/1600, 16/1600, 8/1600, 4/1600, 2/1600, 1/1600), | ||
+ | ( 2/1600, 4/1600, 8/1600, 16/1600, 32/1600, 16/1600, 8/1600, 4/1600, 2/1600), | ||
+ | ( 4/1600, 8/1600, 16/1600, 32/1600, 64/1600, 32/1600, 16/1600, 8/1600, 4/1600), | ||
+ | ( 8/1600, 16/1600, 32/1600, 64/1600, 128/1600, 64/1600, 32/1600, 16/1600, 8/1600), | ||
+ | ( 16/1600, 32/1600, 64/1600, 128/1600, 256/1600, 128/1600, 64/1600, 32/1600, 16/1600), | ||
+ | ( 8/1600, 16/1600, 32/1600, 64/1600, 128/1600, 64/1600, 32/1600, 16/1600, 8/1600), | ||
+ | ( 4/1600, 8/1600, 16/1600, 32/1600, 64/1600, 32/1600, 16/1600, 8/1600, 4/1600), | ||
+ | ( 2/1600, 4/1600, 8/1600, 16/1600, 32/1600, 16/1600, 8/1600, 4/1600, 2/1600), | ||
+ | ( 1/1600, 2/1600, 4/1600, 8/1600, 16/1600, 8/1600, 4/1600, 2/1600, 1/1600) | ||
+ | ); | ||
+ | // Eine 9x9 Gaussian Blur Matrix. | ||
+ | |||
+ | // ... | ||
+ | begin | ||
+ | glEnable(GL_CONVOLUTION_2D); | ||
+ | glConvolutionFilter2D(GL_CONVOLUTION_2D, GL_LUMINANCE4, 9, 9, GL_LUMINANCE, GL_FLOAT, @GaussMatrix[0, 0]); | ||
+ | // Textur laden | ||
+ | end; | ||
+ | </pascal> | ||
+ | |||
+ | Für normale bearbeitungen sollte GL_LUMINANCE angemessen sein, da dort der Filterkern auf die drei Farbkanäle angewandt wird. Als alternative kann man auch eine Matrix bauen, die für jeden Kanal ein anderes Ergebnis erzielt, indem man die Werte für Rot, Grün und Blau nacheinander in dem Faltungskern ablegt und den fünften Parameter auf GL_RGB setzt, genauso wie den zweiten. | ||
== Beispiel Faltungskerne == | == Beispiel Faltungskerne == |
Version vom 11. April 2008, 15:45 Uhr
Inhaltsverzeichnis
Convolution-Filter
In der Bildverarbeitung spricht man auch von Faltungskernen, in Gimp ist der Begriff Faltungsmatrix üblich.
Ein Convolution-Filter ist ein ein- bzw. zweidimensionales Array, dessen Werte Gewichtungen darstellen. Bei Ausführung der Filterung wird das Array Pixel für Pixel auf ein Bild bzw. eine Textur anwendet. Dabei werden die Werte im Array mit den Farben des Bildes multipliziert und zusammenaddiert.
Ist z.B. ein 3x3-Array als Filterkernel gesetzt, so wird der Mittelpunkt auf jedes Pixel gesetzt und die 8 Nachbarpixel um diesen herum mit den Werten in der Matrix verrechnet. Das Ergebnis dieser Rechnung wird in das Pixel gespeichert was im Zentrum der Matrix lag.
Damit lassen sich interessante Effekte wie z.B. Kontraste, Schärfung, Weichzeichnen, Kantenextraktion(Embossing) oder Glowing erzielen.
Ein klein wenig Theorie
Ein (diskreter) Faltungskern g wird auf ein Signal f (z.B. ein Bild) durch eine einfache Rechenvorschrift angewandt:
Hierbei ist D der gemeinsame Definitionsbereich von f und g. Für Bilder bietet sich hier z.B. das kartesische Quadrat der ganzen Zahlen an. Was also passiert hier? Nehmen wir zuerst den einfachsten Faltunskern
Setzt man diese Funktion in die obige Definition ein, so passiert dem Signal: gar nichts, denn die Summe fällt zusammen und es bleibt immer nur (f*g)(x) = g(0)*f(x) = f(x) stehen. Erweitert man nun den Support (der Bereich, auf dem die Funktion nicht 0 ist) des Faltungskern vom Punkt 0 auf auf den Bereich [-1,1]^2
so addiert man durch die Faltung an einer Stelle x des Bildes f mit g, auch alle direkt benachbarten Bildpunkte auf und blendet sie so zusammen - dabei verschwinden die Details im Bild (Details haben in der Signalverarbeitung eine hohe Frequenz) und es bleiben nur die Informationen, die sich lokal um unseren Bildpunkt nicht so sehr ändern (also eine niedrige Frequenz haben); g unterdrückt also hohen Frequenzen und lässt die niedrigen durch - weshalb g ein Tiefpass-Filter genannt wird. Andererseits erkennt man, daß der Faltungskern g beschreibt, mit welchen Faktoren benachbarte Bildpunkte im Ergebnis zusammengeblendet werden. Der Bereich in dem g gleich 0 ist, ist damit aber völlig unerheblich und man beschränkt sich zum Speichern des Kerns auf dessen Support, was zu den bereits erwähnten Darstellungen mit Matrizen führt.
Faltungskerne und OpenGL
Um solche Kerne in OpenGL zu verwenden, gibt es die Funktionen um glConvolutionFilter. Für eine genauere Referenz der Parameter sollte man sich am besten den Funktionsartikel anschauen. Um einen Gaussischen Blur zu implementieren, ist folgender Code angemessen:
const GaussMatrix: array [0..8] of array [0..8] of Single = ( ( 1/1600, 2/1600, 4/1600, 8/1600, 16/1600, 8/1600, 4/1600, 2/1600, 1/1600), ( 2/1600, 4/1600, 8/1600, 16/1600, 32/1600, 16/1600, 8/1600, 4/1600, 2/1600), ( 4/1600, 8/1600, 16/1600, 32/1600, 64/1600, 32/1600, 16/1600, 8/1600, 4/1600), ( 8/1600, 16/1600, 32/1600, 64/1600, 128/1600, 64/1600, 32/1600, 16/1600, 8/1600), ( 16/1600, 32/1600, 64/1600, 128/1600, 256/1600, 128/1600, 64/1600, 32/1600, 16/1600), ( 8/1600, 16/1600, 32/1600, 64/1600, 128/1600, 64/1600, 32/1600, 16/1600, 8/1600), ( 4/1600, 8/1600, 16/1600, 32/1600, 64/1600, 32/1600, 16/1600, 8/1600, 4/1600), ( 2/1600, 4/1600, 8/1600, 16/1600, 32/1600, 16/1600, 8/1600, 4/1600, 2/1600), ( 1/1600, 2/1600, 4/1600, 8/1600, 16/1600, 8/1600, 4/1600, 2/1600, 1/1600) ); // Eine 9x9 Gaussian Blur Matrix. // ... begin glEnable(GL_CONVOLUTION_2D); glConvolutionFilter2D(GL_CONVOLUTION_2D, GL_LUMINANCE4, 9, 9, GL_LUMINANCE, GL_FLOAT, @GaussMatrix[0, 0]); // Textur laden end;
Für normale bearbeitungen sollte GL_LUMINANCE angemessen sein, da dort der Filterkern auf die drei Farbkanäle angewandt wird. Als alternative kann man auch eine Matrix bauen, die für jeden Kanal ein anderes Ergebnis erzielt, indem man die Werte für Rot, Grün und Blau nacheinander in dem Faltungskern ablegt und den fünften Parameter auf GL_RGB setzt, genauso wie den zweiten.
Beispiel Faltungskerne
Tiefpass / Mittelwert
Es wird der Mittelwert zwischen der Farbe des aktuellen Pixels und seinen 8 Nachbarn berechnet und dem aktuellen Pixel zugewiesen. In den Zahlen drück sich dies so aus, dass alle 9 Matrix-Einträge gleichstark (1/9) in die resultierende Farbe eingehen.
1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
Schärfung
0 -1 0 -1 5 -1 0 -1 0
Horizontale Schärfung
-1 -1 -1 2 3 2 -1 -1 -1
Embossing (Kantenfindung)
Richtung links oben
1 0 0 0 0 0 0 0 -1
Richtung rechts unten
-1 0 0 0 0 0 0 0 1
Sobel-Filter
-1 -2 -1 0 1 0 1 2 1
Gaussian Blur
0.00000067 0.00002292 0.00019117 0.00038771 0.00019117 0.00002292 0.00000067 0.00002292 0.00078633 0.00655965 0.01330373 0.00655965 0.00078633 0.00002292 0.00019117 0.00655965 0.05472157 0.11098164 0.05472157 0.00655965 0.00019117 0.00038771 0.01330373 0.11098164 0.22508352 0.11098164 0.01330373 0.00038771 0.00019117 0.00655965 0.05472157 0.11098164 0.05472157 0.00655965 0.00019117 0.00002292 0.00078633 0.00655965 0.01330373 0.00655965 0.00078633 0.00002292 0.00000067 0.00002292 0.00019117 0.00038771 0.00019117 0.00002292 0.00000067
OpenGL-Befehle
glConvolutionFilter1D, glConvolutionFilter2D, glConvolutionParameter, glGetConvolutionFilter, glGetConvolutionParameter
Siehe Auch
Bildverarbeitungsscript von Dr. Steinmüller TU Chemnitz (deutsch) Ausführliche Beschreibung von Faltungskernen ab Kapitel 2.3
[http://www.vbaccelerator.com/home/VB/Code/vbMedia/Image_Processing/Blurring__Sharpening_and_Embossing/article.asp Beschreibung einiger Faltungskerne (englisch)