56
Viertes Kapitel: Das apriorische § 4]
liert ist. Die beiden Grenzwerte 0 und 1 haben also bei nicht-gerad
liniger Regression nicht den Sinn, in welchem sie bei geradliniger Re
gression zu interpretieren sind. Weiß man nicht von vornherein, daß
die Regression geradlinig ist, so darf man vom Werte 0 des Korrelations
koeffizienten nicht darauf schließen, daß die Variablen nicht-korreliert
sind. Ebensowenig darf man davon, daß der Korrelationskoeffizient
unter 1 bleibt, darauf schließen, daß kein funktioneller Zusammenhang
vorliegt; es bleibt nicht ausgeschlossen, daß der Zusammenhang doch
ein funktioneller, aber kein linearer ist.
Wenn man also nicht sicher weiß, daß die Regression geradlinig ist,
so muß man die zahlenmäßigen Werte des Korrelationskoeffizienten
vorsichtig interpretieren. Um Mißdeutungen zu vermeiden, empfiehlt
es sich in solchen Fällen, die Werte des Korrelationsverhältnisses zu be
rechnen, welche bei beliebigen Abhängigkeitsgesetzen denselben Sinn be
halten. Als Maß der Strammheit der Verbundenheit ist deswegen das
Korrelations Verhältnis dem Korrelationskoeffizienten vorzuziehen. Der
Korrelationskoeffizient darf eben nur dann als ein korrektes Maß der
Strammheit auftreten, wenn er das Korrelationsverhältnis vertreten
kann, da die zahlenmäßigen Werte der beiden zusammenfallen. Sonst
wird die Strammheit der Verbundenheit systematisch unterschätzt,
wenn sie mit dem Korrelationskoeffizienten gemessen wird.
Das Interesse, welches an dem Werte des Korrelationskoeffizienten
haftet, beschränkt sich jedoch nicht darauf, daß der Korrelationskoeffi
zient unter gewissen Vorbehalten als ein passendes Maß der Strammheit
der Verbundenheit zwischen den Variablen auftreten kann. Wir haben
gesehen (vgl. oben § 3, 4.), daß selbst bei nicht-geradliniger Regression
die Gerade, deren Gleichung in normalen Koordinaten ~ r in
lautet, als eine approximative Darstellung der wahren Regressionslinie
gelten darf und, als solche, stets ein gewisses Interesse für den Forscher
bietet — sei es auch als eine Art vorläufiger Rekognoszierung auf dem be
treffenden Gebiete. Diese Gerade zeigt uns, ob der bedingte erwartungs
mäßige Wert von Y mit der Zunahme von X im Durchschnitte zu- oder
abnimmt, und gibt außerdem das Durchschnittsmaß der Zu- bzw. Ab
nahme an. Die Gleichung dieser Geraden wird nun durch den Wert des
Korrelationskoeffizienten bestimmt. Ist der Korrelationskoeffizient po
sitiv, so nimmt die bedingte mathematische Erwartung von Y mit dem
Wachsen von X um so ausgesprochener zu, je größer der Korrelations
koeffizient ist; ist der Korrelationskoeffizient negativ, so nimmt sie mit
wachsendem X um so merklicher ab, je näher sich der Korrelations
koeffizient an —1 stellt. Anderseits wird die Gleichung der Geraden,
welche die wahre Regressionslinie von X in bezug auf Y am besten
wiedergibt, ebenfalls durch den Wert des Korrelationskoeffizienten r ltl
bestimmt. Der Wert des Korrelationskoeffizienten gibt uns somit auch
im Falle nicht-geradliniger Regression in greifbarer Form eine ziemlich
reichliche Information über die Verbundenheit zwischen den Variablen.