§5]
101
auf Grund empirischer Werte
§ 5.
Die nähere Betrachtung der mathematischen Erwartungen der Funk
tionen der empirischen Werte, welche der Schätzung der apriorischen
Maßzahlen zugrunde gelegt werden, hat gezeigt, daß die Schätzung fast
ausnahmslos mit einem systematischen Fehler behaftet ist, der bald
nach der einen, bald nach der anderen Seite ausschlagen kann, so daß
der gesuchte Wert bald systematisch überschätzt, bald systematisch
unterschätzt wird. Bei der Beurteilung dieser theoretischen Ergeb
nisse vom Standpunkte der Praxis der statistischen Korrelationsfor
schung kommt es nicht so sehr auf das Vorhandensein wie auf die mög
liche Größe des systematischen Schätzungsfehlers an, und zwar vor
allem auf die relative Größe des systematischen Schätzungsfehlers im
Vergleich zum mittleren Fehler der betreffenden Funktion der empi
rischen Werte. Nur w'enn der systematische Schätzungsfehler von der
Größenordnung des mittleren Fehlers ist, wird seine Nichtbeachtung
auf die Ergebnisse der Forschung wesentlich störend einwirken.
Von diesem Gesichtspunkte aus betrachtet, fallen die Ergebnisse der
theoretischen Untersuchungen der systematischen Schätzungsfehler ver
hältnismäßig günstig aus. Mit zunehmender Versuchszahl nehmen die
systematischen Schätzungsfehler, wie wir gesehen haben, schnell ab.
Nur bei geringen Versuchszahlen können sie schwerer ins Gewicht fallen.
Aber bei geringen Versuchszahlen sind auch die mittleren Fehler groß.
Von besonderer Bedeutung ist der Umstand, daß der systematische
Schätzungsfehler in der Regel von der Größenordnung y and der mitt-
lere Fehler von
der Größenordnung
ist, so daß bei einer einiger
maßen erheblichen Versuchszahl N der systematische Fehler als gering
im Vergleich zum mittleren Fehler zu gelten hat. Man betrachte z. B.
näher die mathematische Erwartung des empirischen Korrelations
koeffizienten im Falle der normalen Korrelation. Der systematische
Fehler ist in diesem Falle, innerhalb der Grenzen unserer Approxima
tion, stets negativ und gleich
r i 11 [ x — r i i i]
2 N
und der mittlere Fehler ist in
der ersten Annäherung gleich
1-rf
V N
Bei nicht sehr großen Versuchs
zahlen kann der systematische Schätzungsfehler nicht unerheblich sein:
N muß z. B. größer als 20 sein, damit man sicher sei, daß die zweite
Dezimale durch den systematischen Schätzungsfehler nicht getroffen
wird. Aber der mittlere Fehler ist stets erheblich größer: das Verhält
nis des systematischen zum mittleren Fehler ist gleich l l ^. Bei N = 20
r 111
'VN
muß der apriorische Korrelationskoeffizient 3 / 4 erreichen, damit der
mittlere Fehler nicht von der Größenordnung der ersten Dezimale sei.