Proč hodnota R-Squared neukazuje nic na příčinnou souvislost?

Proč hodnota R-Squared neukazuje nic na příčinnou souvislost?
Anonim

Odpovědět:

R-kvadrát udává, jak dobře sledovaná data vyhovují očekávaným datům, ale poskytuje pouze informace o korelaci.

Vysvětlení:

Hodnota R-kvadrát udává, jak dobře vaše pozorovaná data nebo data, která jste shromáždili, odpovídají očekávanému trendu. Tato hodnota vám sděluje sílu vztahu, ale stejně jako všechny statistické testy neexistuje nic, co by vám povědělo příčinu vztahu nebo jeho sílu.

V níže uvedeném příkladu můžeme vidět, že graf vlevo nemá žádný vztah, jak ukazuje nízká hodnota R-čtverců. Graf vpravo má velmi silný vztah, který je indikován hodnotou R-kvadrát hodnoty 1. V žádném z těchto grafů nemůžeme říci, co nakonec způsobuje tento vztah.

Korelace neznamená příčinnou souvislost. Vaše hodnoty X mohou velmi dobře ovlivnit vaše hodnoty Y, ale ve hře mohou být jiné faktory nebo vztah může být způsoben náhodou. Můžeš usoudit kauzality, ale toto je vaše interpretace a nelze ji prokázat statistickým testováním. Mít vysokou R-čtvercovou hodnotu ještě jen řekne sílu vztahu ale ne jeho příčina.

Prokazování příčin je velmi velký úkol. Pokud chcete pochopit příčinnou souvislost, vaše nejlepší sázka je prostřednictvím experimentů.