Je to linie, která dává nejpřesnější vztah mezi proměnnými, pokud má být lineární korelace.
Příklad:
Ve své práci učitele jsem měl pocit, že studenti, kteří dosáhli dobrých výsledků v matematice, také zaznamenali dobré výsledky ve fyzice a naopak.
Tak jsem udělal scatterplot na grafu v Excelu, kde x = matematika a y = fyzika, kde každý student byl reprezentován tečkou.
Všiml jsem si, že sbírka bodů vypadala jako sigar-tvar namísto toho, aby byla všude na místě (to by znamenalo vůbec žádnou korelaci).
A pak jsem udělal dvě věci:
(1) Byl jsem vypočítán koeficient korelace (který byl vysoký)
(2) Nakreslil jsem „linii nejlepšího střihu“
Ten druhý je regresní přímka a můžete k ní mít rovnici.
Z toho můžete učinit více či méně rozumnou predikci jednoho skóre od druhého v závislosti na tom, jak dobrá je korelace (korelace je jiný předmět).
Poznámka:
Existuje spousta 'buts' a 'ifs'. Pro jednu věc musíte mít jistotu, že korelace je lineární.