Politikwissenschaft

 

Webseite durchsuchen

Methoden & R
quantitative Methoden (10)
R GNU (28)

Multinomiale Logistische Regression

9. Mai 2016

Die multinomiale logistische Regression wird verwendet, wenn die abhängige Variable nominalskaliert ist. Um eine multinomiale Regression zu schätzen, muss zuerst eine Referenzkategorie gebildet werden. Für alle anderen Fälle wird dann eine logistische Regression vom Modell geschätzt.

Grundsätzlich kann jede Kategorie als Ausprägung verwendet werden. Kommen in der Referenzkategorie jedoch nur wenige Fälle vor, wird der Standardfehler grösser. Deshalb ist es ratsam, eine Kategorie zu wählen, die viele Fälle enthält. Ein zweites Kriterium für die Wahl der Referenzkategorie ist die Distanz zu den anderen Parteien. Je grösser die Distanz, desto besser.

Lagemasse und Streuung

7. März 2016

Lagemasse sagen etwas über die Lage und das Zentrum der Daten aus, Streuungsmasse, wie die Daten um dieses Zentrum gestreut sind.

lineare Regression: Diagnose

5. Juni 2016

Bei einer linearen Regression können mehrere Probleme auftreten. Man kann prüfen, ob die Beziehung zwischen den Paramtern linear ist, ob die Fehler normalverteilt sind, ob die Varianz konstant ist (Homoskedastizität), ob Multikollinearität herrscht oder ob Extremfälle Probleme verursachen.

lineare Regression mit diskreten und nicht-linearen Prädiktoren

4. April 2016

Neben linearen kontinuierlichen Prädiktoren kann eine lineare Regression auch mit diskreten und nicht-linearen Prädiktoren gerechnet werden. Die Grundlagen der linearen Regression werden im Artikel lineare Regression erklärt. Dieser Artikel wird vorausgesetzt.

Diskrete Prädiktoren

Der einfachste Fall eines diskreten Prädiktors ist eine dichotome Variable. Diese trifft entweder zu oder nicht. Die lineare Regression rechnet für diesen Prädiktor einen Wert aus wie er es auch bei kontinuierlichen Variablen macht. Im Gegensatz zu kontinuierlichen Variablen stellt dieser Wert jedoch keine Steigung dar, da es nur "trifft zu" / "trifft nicht zu" gibt, sondern eine Veränderung des Achsenabschnitts.

Ordinal Logit

25. April 2016

Die ordinale logistische Regression wird verwendet, wenn die abhängige Variable ordinalskaliert ist. Da die Abstände zwischen den einzelnen Ausprägungen nicht gleich sein müssen, kann eine lineare Regression nicht verwendet werden. Hat die ordinale Variable jedoch viele Ausprägungen (ca. neun oder mehr), kann auch eine lineare Regression verwendet werden. Die Ergebnisse der beiden Regressionen unterscheiden sich dann kaum.

Zusammengesetzte Daten (compositional data)

23. Mai 2016

Zusammengesetzte Daten sind Daten, bei denen der Anteil des einen vom Anteil eines oder mehreren anderen abhängt.

Ein einfaches Beispiel (von John Aitchison) ist folgendes: Ich habe einen Topf mit Wasser, Erde und Samen auf der Terrasse. Am Abend messe ich den Anteil dieser drei Stoffe. Am nächsten Morgen messe ich nochmals und stelle fest, dass sich der Anteil Wasser im Topf erhöht hat. Was bedeutet das nun? Eine Möglichkeit wäre, dass es in der Nacht geregnet hat und es damit mehr Wasser im Topf hat. Es könnte aber ebenso gut sein, dass es in der Nacht stark gewindet hat und der Wind Erde und Samen aus dem Topf fortgeblasen hat. Wir können es nicht wissen. Die Daten sind voneinander abhängig.

Methoden Grundlagen

22. Februar 2016

Dieser Artikel gibt eine kurze Einführung in die Methoden. Es gibt eine Vielzahl von Methoden. Je nach Anwendungsfall ist die eine oder andere besser geeignet.

Wichtige Begriffe

Bei der explorativen Forschung wird ein Thema erkundet. Das Ziel ist Vorwissen zu generieren. Bei der deskriptiven Forschung wird nur beschrieben; das Ziel ist die Diagnose und nicht die Ursachenidentifikation. Bei Hypothesentests werden vermutete Zusammenhänge, welche aus der Theorie abgeleitet werden, empirisch überprüft. Bei der Evaluation wird die Wirksamkeit von Massnahmen überprüft. Bei der Überprüfung der Kausalität wird untersucht, ob ein Ereignis oder Zustand die Ursache einer Wirkung ist.

Verteilungen

22. Februar 2016

Verteilungen geben an, wie wahrscheinlich die möglichen Zufallswerte zutreffen. So sind z.B. bei einem Würfel alle Seiten eine Wahrscheinlichkeit von 1/6.

lineare Regression

21. März 2016

Mit einer Regressionsanalyse wird versucht, eine abhängige Variable durch eine oder mehrere unabhängige Variablen zu erklären. Mit einer linearen Regression wird eine lineare Abhängigkeit angenommen, welche mit einer Geraden gezeichnet werden kann. Die lineare Regression sollte nur verwendet werden, wenn die abhängige Variable intervallskaliert oder ratioskaliert ist.

Logistische Regression

11. April 2016

Die logistische Regression kann verwendet werden, wenn die abhängige Variable dichotom ist. Dichotom bedeutet, dass die Variable nur zwei Ausprägungen hat: 0 und 1 (z.B. Mann/Frau; ja/nein). Eine dichotome Variable unterliegt der Bernoulli-Verteilung.