68
Fünftes Kapitel: Das System
[§3
so erhält man eine gebrochene Linie, welche wir als die empirische Re
gressionslinie von Y in bezug auf X bezeichnen werden.
Bei der Betrachtung der empirischen Regressionslinie läßt sich die
selbe Aufgabe stellen, von welcher wir bei der Betrachtung der apriori
schen Regressionslinie ausgegangen sind, nämlich (vgl. Viertes Kapitel,
§ 3, 2.): unter der Annahme, daß die einzelnen mf^-Punkte der gebroche
nen empirischen Regressionslinie auf einer Kurve liegen, welche die Ge
stalt einer Parabel /-ten Grades hat, die Koeffizienten der Gleichung der
Parabel durch die Parameter m, (i' und r auszudrücken. Die mathe
matische Behandlung dieser Aufgabe unterscheidet sich formell nicht
von derjenigen des § 3 des Vierten Kapitels. Die Aufgabe bietet aber
kein größeres statistisches Interesse im Falle der empirischen Regres
sionslinie. Selbst wenn einander zugeordnete empirische Werte der
Variablen X und Y tatsächlich so beschaffen sind, daß alle ra^'-Punkte
genau auf einer Parabel nicht allzu hohen Grades liegen, vermag doch
der Statistiker hieraus keine wertvollen Schlüsse zu ziehen: er muß ja
stets darauf bedacht sein, daß dies auf Zufälligkeiten zurückgehen kann und
das Heranziehen von weiteren Paaren der empirischen Werte von X und
von Y die scheinbare Einfachheit des Verlaufs der Linie aufheben würde.
Bei der Betrachtung der empirischen Regressionslinie konzentriert
sich vielmehr das Interesse auf der Auffindung der Gleichungen einer
solchen Geraden oder einer solchen relativ einfach aussehenden Kurve,
welche die Gesamtheit der in Betracht kommenden Punkte am besten
im Sinne der Methode der kleinsten Quadrate darzustellen vermag, wo
bei man von vornherein damit rechnet, daß die einzelnen Punkte nicht
alle auf der Kurve liegen werden, sondern sich in größeren oder kleine
ren Abständen unregelmäßig um sie herum gruppieren werden. Es sei
also die Aufgabe gestellt, eine Gerade so zu ziehen, daß der gewogene
Durchschnitt der zweiten Potenzen der Differenzen zwischen den wah
ren Durchschnittswerten aller einzelnen Xi- Reihen und den entsprechen
den^ Werten, welche nach der Gleichung der Geraden berechnet werden,
möglichst gering sei (vgl. Viertes Kapitel, § 3, 4.). Schreibt man die
Gleichung der Geraden in der Form
so führt die Bedingung, daß die Summe
s p'„ [ m< 'i - A ',o— A 'n *<J
möglichst gering sei, zu Gleichungen
m n .. — A.„—m' 1[0 A' n = 0, m[ n -
C-4.-
m no ^io"
' m 2 I 0 ^ 11 0 ‘
Hieraus erhalten wir
• ' ii-
a’ _Mm“ m Sio»»(iii _lMn J Y .
' 1_ m' l0 -K 10 ] 2 V 4,0 in* I®'
w ó,i-4iK,o =
.*»310 m 'no
»»2 10-lVlloP