50
Viertes Kapitel: Das apriorische
[§3
= /*/ \0P0\g sowohl ii /n = 0, wie
ist, so erhalten wir nämlich ans g f]g
i = 0 bei beliebigen / und g.
Das Nicht-Korreliertsein bedingt aber nicht die gegenseitige Unab
hängigkeit — nicht einmal in dem Falle, wenn sowohl Y mit X, wie X
mit Y nicht-korreliert ist: ans /¿ A|1 = 0 und [i 1]h =0 bei h = 1, 2, 3, . . .
läßt sich nicht schließen, daß g f]g = ¿t /|0 /¿ 0|p sei, wenn sowohl / wie g
verschieden von 1 sind.
4. Nehmen wir nun an, daß die wahre Regression von Y in bezug
auf X sich durch eine Parabel /-ten Grades darstellen läßt, und wollen
wir versuchen, eine gerade Linie so zu legen, daß sie die wahre Regression
am besten wiedergebe, in dem Sinne, daß die Summe der Quadrate der
Abweichungen der nach der Gleichung der Geraden berechneten be
dingten mathematischen Erwartungen von den entsprechenden wahren
Werten der bedingten mathematischen Erwartungen von Y geringer
sei, als unter der Annahme eines anderen Verlaufs der Geraden. Wird
die Gleichung der gesuchten Geraden in der Form = A i0 + A n x {
geschrieben, so haben wir also die Koeffizienten A |0 und A n so zu wählen,
daß
A ,0~ A n x iT
ihren minimalen Wert erhalte. Beachtet man nun, daß
Sa?«, = 1 > Sp 4| * f = w i i0 ’ SP», = m 0 \i> m n = m ui>
2p,-
2
,x. ■■
I l
2 | 0
so kommt man auf die Gleichungen
m 0ll ^10 ^I1 W 1I0 = 0 m i\l ^I0 W 1I0 ^11 ^2I0 = ^ ’
aus welchen sich die Werte von A ]0 und A n als
4 m \\X »»! | o m 0 I 1 Plll j ^ 4 ^ m 2\0 m 0\l~
^ II — m zr«,2 ,, » ^|0~ Z
m 2IO I 0 r2|0 TO 2|0 "‘'1 | 0
bestimmen lassen. Wir erhalten also für A ]0 und A n dieselben Werte,
wie wenn die wahre Regression eine geradlinige wäre (vgl. oben § 3, 2., A.).
Die Gerade, deren Gleichung
m
(0
= bzw. äR[? = r X,
r2\0
ist, stellt somit die wahre Regressionslinie dar, falls die wahre Regression
von Y in bezug auf X geradlinig ist, und gibt die wahre Regressions
linie mit der besten Approximation wieder, falls die wahre Regression
nicht geradlinig ist. Diese Eigenschaft der Geraden SJij'i = r x , 1 3^ ist
für den Statistiker von großem Werte. Sie setzt den Statistiker in den
Stand, unter allen Umständen von der Regression eine einigermaßen
treffende Vorstellung zu gewinnen, indem er die Gleichung der Geraden
= /*1,13Z; berechnet.
5. Durch die Regressionsgleichung wird eine derjenigen Eigenschaften
des Abhängigkeitsgesetzes erfaßt, welche den Forscher am meisten zu