Cook-Distanz in R berechnen und interpretieren - Ausreißer? - Daten analysieren in R (78)
Автор: Statistik am PC
Загружено: 2021-05-05
Просмотров: 8248
Описание:
// Cook-Distanz in R berechnen und interpretieren - Ausreißer? //
Die Residuen (Unterschied zwischen geschätzten und tatsächlichen Werten der abhängigen Variablen) geben einen Aufschluss darüber, ob gewisse Fälle der Stichprobe ungewöhnlich sind. Mit ungewöhnlich meint man auch einflussreich. Einflussreich deswegen, weil sie bildlich gesprochen die Regressionsgerade von der Punktewolke nach oben oder unten wegziehen. Die Modellgüte leidet im Endeffekt hierunter. Mit der sog. Cook Distanz (Cook's Distance) werden die Residuen auf ihre Abweichung hin quantifiziert. Die Berechnung kann in R über die cooks.distance()-Funktion vorgenommen werden. Alternativ bzw. zusätzlich kann eine grafische Prüfung mittels plot(Modellname, 4) durchgeführt werden. Modellname wäre in dem Falle der Name eures bereits berechneten Regressionsmodells.
Die erhaltenen Cook Distanzen für die einzelnen Fälle werden nun geprüft. Hierzu gibt es 3 verschiedene Vorgehensweisen:
1) Die Cook Distanzen sollten unter 1 liegen. (Cook, Weisberg (1982))
2) Die Cook Distanzen sollten unter 4/n liegen, wobei n die Stichprobengröße ist. Mit zunehmender Stichprobengröße sinkt also die akzeptable Größe. Schon bei einer kleinen Stichprobe von 10 ist sie deutlich unter dem in 1) vorgestellten Schwellenwert von 1. (Hardin, Hilbe (2007))
3) Relative Betrachtung. Wenn der größte Wert ein Vielfaches der anderen Werte beträgt, sollte man aufhorchen.
Allgemein gilt: Die Cook Distanz gibt einen guten Überblick über einflussreiche Fälle. Diese sollte man sich anschauen. Die abhängige Variable ist bei hoher Cook Distanz ungewöhnlich hoch/niedrig für die vorhandenen Ausprägungen der unabhängigen Variablen, was ein Hinweis auf Mess- oder Erfassungsfehler sein kann. Sind diese jedoch nicht erkennbar und die Werte plausibel, scheint es ein Ausreißer zu sein. Ein Ausschluss ist bei einem plausiblen Ausreißer aber nicht zwingend vorzunehmen und zu diskutieren.
Bei Fragen und Anregungen zu Cook-Distanz in R berechnen und interpretieren - Ausreißer?, nutzt bitte die Kommentarfunktion. Ob ihr das Video hilfreich fandet, entscheidet ihr mit einem Daumen nach oben oder unten. #statistikampc
Noch mal zum Nachlesen auf meiner Homepage:
========================================
💡 Cook-Distanz in R berechnen und interpretieren: https://www.bjoernwalther.com/cook-di...
Mehr Tutorials und Begleitmaterial:
============================
🌐Meine Homepage: https://bjoernwalther.com/
📘 Für die Leser unter euch:
=======================
Mein Buch "Statistik mit R - Schnelleinstieg": https://amzn.to/3OzeLJI [Affiliatelink]
Literatur 📚
==========
📚 Cook, R., & Weisberg, S. (1982). Criticism and Influence Analysis in Regression. Sociological Methodology, 13, 313-361.
📚 Hardin, J. W., & Hilbe, J. M. (2007). Generalized linear models and extensions, S. 49.
⭐Kanalmitglied⭐ werden:
=======================
/ @statistikampc_bjoernwalther
Zeitstempel ⏰
============
0:00 Einleitung und Ausgangssituation
0:35 Cook Distanzen grafisch analysieren
2:35 Cook Distanzen berechnen
4:51 Cook Distanzen zur Plausibilitätsprüfung der Fälle
Kanal unterstützen? 🙌🏼
===================
Paypal-Spende: https://www.paypal.com/paypalme/Bjoer...
Amazon Affiliate-Link: http://amzn.to/2iBFeG9
Danke für eure Unterstützung! ♥
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: