Jaký je vztah mezi R-Squared a korelačním koeficientem modelu?

Jaký je vztah mezi R-Squared a korelačním koeficientem modelu?
Anonim

Odpovědět:

Viz. Úvěr Gauravovi Bansalovi.

Vysvětlení:

Snažil jsem se vymyslet nejlepší způsob, jak to vysvětlit, a narazil jsem na stránku, která dělá opravdu pěknou práci. Raději bych dal tomuto chlapci uznání za vysvětlení. V případě, že odkaz nefunguje pro některé, uvedl jsem níže některé informace.

Jednoduše řečeno: # R ^ 2 # hodnota je jednoduše čtvercem korelačního koeficientu # R #.

korelační koeficient (# R #) modelu (řekněme s proměnnými #X# a # y #) má hodnoty mezi #-1# a #1#. Popisuje jak #X# a # y # jsou korelovány.

  • Li #X# a # y # jsou v dokonalém spojení, pak bude tato hodnota pozitivní #1#
  • Li #X# zvyšuje, zatímco # y # klesá přesně opačným způsobem, pak tato hodnota bude #-1#
  • #0# byla situace, kdy neexistuje vzájemná souvislost #X# a # y #

Nicméně, toto # R # hodnota je užitečná pouze pro jednoduchý lineární model (jen #X# a # y #). Jakmile vezmeme v úvahu více než jednu nezávislou proměnnou (nyní máme # x_1 #, # x_2 #, …), je velmi těžké pochopit, co znamená korelační koeficient. Sledování, která proměnná přispívá k korelaci, není tak jasné.

Toto je místo, kde # R ^ 2 # hodnota. Je to prostě čtverec korelačního koeficientu. Přebírá hodnoty mezi #0# a #1#, kde hodnoty blízké #1# znamenají větší korelaci (ať již pozitivně nebo negativně korelovány) a #0# neznamená žádnou korelaci. Jiný způsob, jak si to představit, je jako zlomková variace závislé proměnné, která je výsledkem všech nezávislých proměnných. Pokud závislá proměnná silně závisí na všech jejích nezávislých proměnných, hodnota bude blízká #1#. Tak # R ^ 2 # je mnohem užitečnější, protože může být také použit k popisu vícerozměrných modelů.

Pokud byste chtěli diskutovat o některých matematických pojmech, které se týkají dvou hodnot, viz.