Stichproben
Mittelwert
Für eine Sequenz von Beobachtungen ist der Mittelwert definiert als
Quantil
Für eine Sequenz von Beobachtungen und ein bezeichnen wir die Beobachtung an der Position nach Sortieren der Werte als -Quantil.
Median
Für eine Sequenz von Beobachtungen bezeichnen wir das -Quantil als Median von .
Median Absolute Deviation - MAD
Für eine Sequenz von Beobachtungen ist die median absolute deviation (MAD) definiert als
Empirische Varianz und Standardabweichung
Empirische Kovarianz und Korrelation
Parametrisches Modell
Ein parametrisches Modell ist ein Tripel bestehend aus einer Ergebnismenge , einem Ereignissystem und einer Menge von Wahrscheinlichkeitsverteilungen , die mit einer Indexmenge für ein indiziert. Man spricht von einem -parametrigen Modell.
Schätzer
Für ein parametrisches Modell heißt eine beliebige Zufallsvariable von nach ein Schätzer.
- der Schätzer ist auch eine Zufallsvariable (in Abhängigkeit von den Stichproben)
Mittlerer Quadratischer Schätzfehler
Für ein parametrisches Modell und einen Schätzer ist der mittlere quadratische Fehler (MSE) definiert als
Verzerrungs-Varianz Zerlegung des Schätzfehlers
Für ein parametrisches Modell und einen Schätzer gilt für den mittleren quadratischen Schätzfehler (vorne Verzerrung / bias, hinten Varianz)
Erwartungstreue eines Schätzers
Für ein parametrisches Modell und einen Schätzer ist der Schätzer erwartungstreu, wenn er eine Verzerrung von Null hat, d.h. für alle gilt:
Verteilung von Schätzern
Der empirische Mittelwert einer Stichprobe ist selbst eine Zufallsvariable. Nach dem zentralen Grenzwertsatz gilt damit
Verteilung von Schätzern bei Normalverteilung
Seien unabhängige normalverteilte Zufallsvariablen mit für alle . Dann sind der Mittelwert und die korrigierte Varianz folgendermaßen verteilt
Verteilung des empirischen normierten Mittelwertschätzers
Seien unabhängige normalverteilte Zufallsvariablen mit für alle . Dann ist der normierte Mittelwertschätzer -verteilt mit Freiheitsgraden:
Likelihood
Ist ein parametrisches Model und und sei eine Stichprobe, so heißt die Funktion mit die zugehörige Likelihood, wobei die (Zähl)dichte von ist.
- Die Likelihood ist nicht normiert (summiert / integriert sich nicht zu 1) über !
Maximum Likelihood Schätzer
Ein Schätzer heißt ein Maximum Likelihood Schätzer wenn
Trick: Bestimmte das Maximum des Logarithmus der Likelihood weil aus Produkten Summen werden, der Logarithmus monoton steigend ist und der Wertebereich numerisch besser in Gleitkommzahlen abzubilden ist.
- Die Nullstelle der ersten Ableitung der log-likelihood ist ein möglicher Kandidat
- Zur Überprüfung, dass es sich um ein Maximum handelt, muss noch die zweite Ableitung geprüft werden
MLE der Bernoulliverteilung
Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:
MLE der Poissionverteilung
Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:
MLE der Exponentialverteilung
Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:
MLE der Normalverteilung
Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:
MLE der Varianz der Normalverteilung
Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:
- nicht erwartungstreu wie die korrigierte empirische Varianz
Method of Moments
Momente einer Verteilung
Sei eine reelle Zufallsvariable. Dann heißt das -te Moment von . Gegeben eine Stichprobe ist das -te empirische Moment definiert als
Method of Moments Schätzer
Sei ein parametrisches Modell, das eine unabhängige und identische Verteilung annimmt. Ein Schätzer heißt ein Method of Moments Schätzer, wenn er diejenige Verteilung berechnet, bei welcher das -te Moment dem -ten empirischen Moment entspricht:
Konfidenzintervall
Betrachte ein parametrisches Modell , eine Kenngrößenfunktion und eine reelle Zahl . Wir nennen die Abbildung ein Konfidenzintervalll zum Irrtumsniveau genau dann, wenn für alle gilt, dass
- Wir bezeichen als das Konfidenzniveau
- ist bei ein-parametrigen Modellen oft die Identität und bei mehrparametrigen Modellen eine Projektion
Konstruktion von Konfidenzintervallen
Nachtragen (Unit 10a Slide 9)
Konfidenzintervalle unter Normalverteilungsannehme
Zweiseitiges Konfidenzintervall für den Erwartungswert
Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und bekannter Varianz . Sei das -Quantil der Standardnormalverteilung, d.h. . Dann ist das zweiseitige Konfidenzintervall für zum Konfidenzniveau gegeben durch
Einseitige Konfidenzintervalle für den Erwartungswert
Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und bekannter Varianz . Sei das -Quantil der Standardnormalverteilung, d.h. . Dann sind die folgenden Konfidenzintervalle für zum Konfidenzniveau gegeben durch
Unteres Konfidenzintervall:
Oberes Konfidenzintervall:
Konfidenzintervalle für den Erwartungswert ohne Varianz
Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und unbekannter Varianz . Sei das -Quantil der -Verteilung mit Freiheitsgraden. Dann sind die folgenden Konfidenzintervalle für zum Konfidenzniveau gegeben durch
Nachtragen (Unit 10a Slide 17)
Konfidenzintervalle für die Varianz
Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und unbekannter Varianz . Sei das -Quantil der -Verteilung mit Freiheitsgraden. Sei . Dann sind die folgenden Konfidenzintervalle für zum Konfidenzniveau gegeben durch
Nachtragen (Unit 10a Slide 20)
Konfidenzintervalle
Konstruktion von approximativen Konfidenzintervallen
- Wir nutzen Normalverteilungsapproximation der Summe (Bernoulli, Exponential, etc.)
Für , wähle via ein symmetrisches Intervall um mit Wahrscheinlichkeit
Trick: Für den Nenner benutzen wir den MLE (Maximum Likelihood Schätzer) von gegeben durch . Durch Umformungen erhalten wir:
Größtes Konfidenzintervall bei Damit lässt sich benötigte Stichprobengröße für gegebene Konfidenz (Größe des Intervalls) berechnen
Approximatives Konfidenzintervall für den Erwartungswert
- Wir treffen keine konkrete Verteilungsannahme
Tschebyscheff-Ungleichung
Sei eine reelle Zufallsvariable mit Erwartungswert und Varianz. Dann gilt für alle :
Approximatives Konfidenzintervall für den Erwartungswert
Sei ein parametrisches Modell mit für alle . Dann ist das folgende Intervall ein Konfidenzintervall zum Niveau