62
Viertes Kapitel: Das apriorische [§ 6, § 7
des Korrelationskoeffizienten leicht berechnen. Da aber im Falle, wenn
die beiden Regressionen geradlinig sind, die zweite Potenz des Korre
lationskoeffizienten den Korrelationsverhältnissen rj y , * und rf x , y identisch
gleich ist (vgl. oben § 4, 3.), so stellt sich in diesem Falle das Produkt
der Koeffizienten a 1{ und a n als dasjenige Maß der Strammheit der
Verbundenheit zwischen den Variablen dar, welches wir als das beste
anerkannt haben.
In dem Falle, w^enn die tatsächlichen Regressionslinien von Y in
bezug auf X und von X in bezug auf Y keine Geraden sind, aber die
Gleichungen der an dieselben am besten angepaßten Geraden (vgl. oben
§ 3, 4.) bekannt sind, sind wir gleichfalls imstande, den Wert des Korre
lationskoeffizienten zu bestimmen, da das Produkt der Koeffizienten
A u und M u in den Gleichungen dieser Geraden gleichfalls der zweiten
Potenz des Korrelationskoeffizienten identisch gleich ist. Wir sind je
doch unter solchen Verhältnissen nicht mehr berechtigt, von dem Werte
des Korrelationskoeffizienten auf die Werte der Korrelationsverhältnisse
zu schließen. Falls die tatsächliche Regressionslinie von Y in bezug auf
X keine Gerade ist, ist der Korrelationskoeffizient, der absoluten Größe
nach, stets geringer als das Korrelationsverhältnis von Y zu X (vgl.
oben § 4, 3.). Unter solchen Verhältnissen erscheint der numerische Wert
des Korrelationskoeffizienten, welchen wir als das geometrische Mittel
aus den Werten der Koeffizienten A u und A n berechnen, nicht mehr
als ein genaues Maß der tatsächlichen Strammheit der Verbundenheit
zwischen X und Y. Falls man bei der Schätzung vom numerischen
Werte des Korrelationskoeffizienten ausgeht, wird die Strammheit mehr
oder weniger unterschätzt, je nach der tatsächlichen Gestaltung der Re
gressionslinien. Der Korrelationskoeffizient bleibt kleiner als 1 selbst,
wenn der Zusammenhang zwischen X und Y ein funktioneller ist.
§ 7.
Unser Überblick der Verfahren, welche bei der Untersuchung von
zwei stochastisch verbundenen Variablen angewandt werden, ist weit
davon entfernt, ein erschöpfender zu sein. Ich habe mich darauf be
schränken müssen, die Grundgedanken systematisch zu entwickeln, auf
welchen die moderne Theorie der von den Statistikern anzuwendenden
Verfahren beruht. Auf die Schilderung der näheren Ausgestaltung der
selben, auf ihre Anpassung an die Eigenarten der Problemstellungen,
sowie an die Besonderheiten in der Gestaltung des dem Statistiker vor
liegenden Materials dürfen wir uns nicht einlassen. Nicht einmal das
bei der Besprechung der Mean square Contingeney kurz berührte reiz
volle Problem der statistischen Untersuchung der zufällig variablen
nicht-quantitativen Merkmale kann ausführlicher behandelt werden. Ich
möchte jedoch nicht unerwähnt lassen, daß die Begriffe des Korre
lationskoeffizienten und des Korrelationsverhältnisses, obgleich sie im
allgemeinen Falle von der Voraussetzung quantitativ verschiedener Werte