Politikwissenschaft

 

Webseite durchsuchen

lineare Regression: Diagnose in R - Linearität

Benjamin Schlegel | 23. Juni 2016

PDF

In diesem Artikel wird erklärt, wie die Linearität der Parameter in R überprüft werden kann. Ein theoretischen Überblick wird im Artikel lineare Regression: Diagnose gegeben.

Als ersten wird der Datensatz World UNDP Data 2014 eingelesen, welcher unter Data heruntergeladen werden kann. Der Datensatz erhält unter anderem Daten zum Bruttonationaleinkommen pro Kopf (gnipc) und Human Development Index (hdi) für jedes Land.


world= read.csv2("world_undp.csv", stringsAsFactors = F)

Anschliessend wird der HDI auf das Bruttonationaleinkommen regressiert und auf das logarithmierte Bruttonationaleinkommen.


model1 = lm(hdi ~ gnipc, data=world)
model2 = lm(hdi ~ log(gnipc), data=world)

Mithilfe der Funktion crPlots aus der Bibliothek car kann die Linearität der Beziehung der Parameter geprüft werden. Die Funktion gibt die tatsächliche Kurve und die Ideallinie zurück. Sind diese genug ähnlich, kann von einer linearen Beziehung ausgegangen werden.


library(car)
crPlots(model1)
nicht lineare Beziehung

Aus der Grafik ist klar ersichtlich, dass es sich um keine lineare Beziehung handelt. Die Grafik weist eher auf eine exponentielle Beziehung hin. Deshalb wird das ganze noch mit dem logarithmierten BNI durchgeführt.


crPlots(model2)
lineare Beziehung

Jetzt ist die Beziehung linear. Die Methode der Linearität hilft zu entscheiden, wann eine Logarithmierung oder ein quadratischer Term sinnvoll ist.