Stichproben

Mittelwert

Für eine Sequenz von Beobachtungen ist der Mittelwert definiert als

Quantil

Für eine Sequenz von Beobachtungen und ein bezeichnen wir die Beobachtung an der Position nach Sortieren der Werte als -Quantil.

Median

Für eine Sequenz von Beobachtungen bezeichnen wir das -Quantil als Median von .

Median Absolute Deviation - MAD

Für eine Sequenz von Beobachtungen ist die median absolute deviation (MAD) definiert als

Empirische Varianz und Standardabweichung

Empirische Kovarianz und Korrelation


Parametrisches Modell

Ein parametrisches Modell ist ein Tripel bestehend aus einer Ergebnismenge , einem Ereignissystem und einer Menge von Wahrscheinlichkeitsverteilungen , die mit einer Indexmenge für ein indiziert. Man spricht von einem -parametrigen Modell.

Schätzer

Für ein parametrisches Modell heißt eine beliebige Zufallsvariable von nach ein Schätzer.

  • der Schätzer ist auch eine Zufallsvariable (in Abhängigkeit von den Stichproben)

Mittlerer Quadratischer Schätzfehler

Für ein parametrisches Modell und einen Schätzer ist der mittlere quadratische Fehler (MSE) definiert als

Verzerrungs-Varianz Zerlegung des Schätzfehlers

Für ein parametrisches Modell und einen Schätzer gilt für den mittleren quadratischen Schätzfehler (vorne Verzerrung / bias, hinten Varianz)

Erwartungstreue eines Schätzers

Für ein parametrisches Modell und einen Schätzer ist der Schätzer erwartungstreu, wenn er eine Verzerrung von Null hat, d.h. für alle gilt:

Verteilung von Schätzern

Der empirische Mittelwert einer Stichprobe ist selbst eine Zufallsvariable. Nach dem zentralen Grenzwertsatz gilt damit

Verteilung von Schätzern bei Normalverteilung

Seien unabhängige normalverteilte Zufallsvariablen mit für alle . Dann sind der Mittelwert und die korrigierte Varianz folgendermaßen verteilt

Verteilung des empirischen normierten Mittelwertschätzers

Seien unabhängige normalverteilte Zufallsvariablen mit für alle . Dann ist der normierte Mittelwertschätzer -verteilt mit Freiheitsgraden:


Likelihood

Ist ein parametrisches Model und und sei eine Stichprobe, so heißt die Funktion mit die zugehörige Likelihood, wobei die (Zähl)dichte von ist.

  • Die Likelihood ist nicht normiert (summiert / integriert sich nicht zu 1) über !

Maximum Likelihood Schätzer

Ein Schätzer heißt ein Maximum Likelihood Schätzer wenn

Trick: Bestimmte das Maximum des Logarithmus der Likelihood weil aus Produkten Summen werden, der Logarithmus monoton steigend ist und der Wertebereich numerisch besser in Gleitkommzahlen abzubilden ist.

  • Die Nullstelle der ersten Ableitung der log-likelihood ist ein möglicher Kandidat
  • Zur Überprüfung, dass es sich um ein Maximum handelt, muss noch die zweite Ableitung geprüft werden

MLE der Bernoulliverteilung

Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:

MLE der Poissionverteilung

Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:

MLE der Exponentialverteilung

Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:

MLE der Normalverteilung

Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:

MLE der Varianz der Normalverteilung

Seien unabhängig und . Dann ist der Maximum Likelihood Schätzer für gegeben durch:

  • nicht erwartungstreu wie die korrigierte empirische Varianz

Method of Moments

Momente einer Verteilung

Sei eine reelle Zufallsvariable. Dann heißt das -te Moment von . Gegeben eine Stichprobe ist das -te empirische Moment definiert als

Method of Moments Schätzer

Sei ein parametrisches Modell, das eine unabhängige und identische Verteilung annimmt. Ein Schätzer heißt ein Method of Moments Schätzer, wenn er diejenige Verteilung berechnet, bei welcher das -te Moment dem -ten empirischen Moment entspricht:


Konfidenzintervall

Betrachte ein parametrisches Modell , eine Kenngrößenfunktion und eine reelle Zahl . Wir nennen die Abbildung ein Konfidenzintervalll zum Irrtumsniveau genau dann, wenn für alle gilt, dass

  • Wir bezeichen als das Konfidenzniveau
  • ist bei ein-parametrigen Modellen oft die Identität und bei mehrparametrigen Modellen eine Projektion

Konstruktion von Konfidenzintervallen

Nachtragen (Unit 10a Slide 9)

Konfidenzintervalle unter Normalverteilungsannehme

Zweiseitiges Konfidenzintervall für den Erwartungswert

Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und bekannter Varianz . Sei das -Quantil der Standardnormalverteilung, d.h. . Dann ist das zweiseitige Konfidenzintervall für zum Konfidenzniveau gegeben durch

Einseitige Konfidenzintervalle für den Erwartungswert

Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und bekannter Varianz . Sei das -Quantil der Standardnormalverteilung, d.h. . Dann sind die folgenden Konfidenzintervalle für zum Konfidenzniveau gegeben durch

Unteres Konfidenzintervall:

Oberes Konfidenzintervall:

Konfidenzintervalle für den Erwartungswert ohne Varianz

Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und unbekannter Varianz . Sei das -Quantil der -Verteilung mit Freiheitsgraden. Dann sind die folgenden Konfidenzintervalle für zum Konfidenzniveau gegeben durch

Nachtragen (Unit 10a Slide 17)

Konfidenzintervalle für die Varianz

Seien unabhängige normalverteilte Zufallsvariablen mit unbekanntem Erwartungswert und unbekannter Varianz . Sei das -Quantil der -Verteilung mit Freiheitsgraden. Sei . Dann sind die folgenden Konfidenzintervalle für zum Konfidenzniveau gegeben durch

Nachtragen (Unit 10a Slide 20)


Konfidenzintervalle

Konstruktion von approximativen Konfidenzintervallen

  • Wir nutzen Normalverteilungsapproximation der Summe (Bernoulli, Exponential, etc.)

Für , wähle via ein symmetrisches Intervall um mit Wahrscheinlichkeit

Trick: Für den Nenner benutzen wir den MLE (Maximum Likelihood Schätzer) von gegeben durch . Durch Umformungen erhalten wir:

Größtes Konfidenzintervall bei Damit lässt sich benötigte Stichprobengröße für gegebene Konfidenz (Größe des Intervalls) berechnen

Approximatives Konfidenzintervall für den Erwartungswert

  • Wir treffen keine konkrete Verteilungsannahme

Tschebyscheff-Ungleichung

Sei eine reelle Zufallsvariable mit Erwartungswert und Varianz. Dann gilt für alle :

Approximatives Konfidenzintervall für den Erwartungswert

Sei ein parametrisches Modell mit für alle . Dann ist das folgende Intervall ein Konfidenzintervall zum Niveau