If you're seeing this message, it means we're having trouble loading external resources on our website.

Jeżeli jesteś za filtrem sieci web, prosimy, upewnij się, że domeny *.kastatic.org i *.kasandbox.org są odblokowane.

Główna zawartość

Przykład linii regresji

Przykład linii regresji. Stworzone przez: Sal Khan.

Chcesz dołączyć do dyskusji?

Na razie brak głosów w dyskusji
Rozumiesz angielski? Kliknij tutaj, aby zobaczyć więcej dyskusji na angielskiej wersji strony Khan Academy.

Transkrypcja filmu video

. Na przestrzeni kilku ostatnich filmów zajmowaliśmy się całkiem zaawansowaną matematyką. Możliwe nawet, że je pominąłeś. Ostatecznie jednak, otrzymaliśmy dość zgrabny wynik. Otrzymaliśmy równanie na nachylenie i wyraz wolny optymalnie dopasowanej linii regresji, gdy błąd mierzony jest jako kwadrat odległości od linii. I nasze równanie to, przepiszę je tu byśmy mieli coś ładnego na co możemy popatrzeć. A więc nachylenie linii jest równe średniej z x przemnożonej przez średnią z y pomniejszoną o średnią z xy. Nie przejmuj się, że wygląda to na zagmatwane. Za kilka sekund przyjrzymy się temu na przykładzie. Poczielone przez średnią x'ów podniesionych do kwadratu pomniejszoną o średnią x'ów podniesioną do kwadratu. Jeśli wygląda to nieco inaczej, niż to na co trafiłeś w trakcie swoich zajęć ze statystyki lub w podręczniku, to pewnie widziałeś to w postaci przekształconej. Jeśli przemnożysz licznik i mianownik przez minus 1, zobaczyłbyś średnią xy pomniejszoną o średnią x przemnożoną przez średnią y. To dzielone przez średnią z x-ów podniesionych do kwadratu minus średnią x-ów podniesioną do kwadratu. To oczywiście ten sam rezultat. Po prostu mnożymy licznik i mianownik przez minus 1, co jest tym samym co przemnożenie całości przez 1. I dalej, cokolwiek otrzymamy jako m, możemy to podstawić do równania wyznacającego b. b równa się średniej z y pomniejszonej o nasze m użyję żółtego koloru, żeby to wyróżnić. Wyznaczyliśmy już wartość m. Minus m przemnożone przez średnią x. . I to wszystko czego potrzebujemy. Przetestujmy to na przykładzie. Załózmy, że mamy 3 punkty, takie które nie leżą na linii prostej. Gdyby leżały zadanie nie byłoby interesujące. Narysuję te punkty tutaj. Powiedzmy, że pierwszy punkt to (1,2). A więc to jest (1,2) . Weźmy też punkt (2,1). . Dalej, załóżmy, że mamy również punkt, zróbmy coś szalonego, np. (4,3). . To jest (4,3). Oto nasze trzy punkty. To wszystko czego potrzebujemy by znaleźć optymalnie dopasowaną linię regresji, co do której oczekujemy, że będzie wyglądać jakoś tak. Sprawdzimy, jak będzie wyglądać w rzeczywistości używając naszych równań, których prawdziwości dowiedliśmy. Dobrym startem będzie obliczenie tych wartości tutaj, i podstawienie ich do równań. Ile wynosi więc średnia x? Średnia x czyli 1+2+4 podzielone przez 3. Czyli ile to będzie? 1+2 to 3, po dodaniu 4 mamy 7 i to dzielimy na 3. Wynik to 7/3 Teraz, ile wynosi średnia y? Średnia y czyli 2+1+3 . Dzielone przez 3. 2 plus 1 daje 3. Plus 3 to razem 6. Co po podzieleniu przez 3 daje 2. Czyli mamy 6 dzielone przez 3 co jest równe 2. Dalej, ile wynosi średnia xy? . Nasza pierwsza wartość xy tutaj to 1 razy 2. Dodać 2 razy 1, dodać 4 razy 3. . I tak mamy 3 wartości xy. Co dzielimy przez 3. Jaki jest więc wynik? Mamy 2 plus 2 co daje 4. 4 plus 12 co równa się 16. A więc mamy 16/3. Ostatnią rzeczą do policzenia jest średnia z x podniesionych do kwadratu. Ile więc wynosi średnia x do kwadratu? Pierwszy x do kwadratu, czyli 1 do kwadratu. . Dodać 2 do kwadratu, dodać 4 do kwadratu. . Znowu mamy 3 punkty. Czyli to daje 1 plus 4 a więc 5. Dodać 16. To wynosi 21/3, co równa się 7. A więc mamy całkiem okrągły wynik. Wyznaczmy więc nasze m i b. A więc nachylenie, optymalne nachylenie linii regresji, średnia x wynosi 7/3 . mnożymy to przez średnią y. średnia y wynosi 2. minus średnia xy, czyli 16/3. Dalej, to wszystko dzielone przez średnią x, średnia x wynosi 7/3 i to do kwadratu. . Odjąć średnią x podniesionych do kwadratu. A więc dojąć 7, o tutaj. Dalej, musimy dokonać kilku przekształaceń. Kusi mnie żeby sięgnąć po kalkulator, ale spróbuję się oprzeć tej pokusie. Dobrze jest trzymać się ułamków. Sprawdźmy czy umiem to policzyć. 14/3 minus 16/3. To dzielone przez : tu mamy 49/9 pomniejszone o 7. Chcę wyrazić to jako iloraz czegoś i 9, co daje 63/9. A więc w naszym liczniku mamy 2/3. Tymczasem w mianowniku, ile to jest 49-63? To daje -14/9. To dokładnie tyle co -2/3 mnożone przez -9/14. Podzielmy licznik i mianiownik przez 3. Znaki minus kasują się wzajemnie. Dzielimy przez 3. To daje 1. A to zamienia się w 3. Dzielę przez 2. Otrzymuję 1. Tutaj dostaję 7. A więc nachylenie to 3/7 nie jest źle. Teraz, możemy cofnąć się i wyznaczyć wyraz wolny. Obliczmy wyraz wylny używając tego wyrażenia tutaj. A więc wyraz wolny jest równy średniej wartości y, która wynosi 2, minus nachylenie. Nachylenie wyznaczyliśmy jako 3/7, . mnożone przez średnią x, czyli 7/3. . Te liczby są swoimi odwrotnościami, a więc skracają się. I dostajemy 1. Czyli nasz wyraz wolny to 2 minus 1, co równa się 1. Mamy więc równanie naszej linii. Nasza linia regresji to, wyliczyliśmy m. m = 3/7. y jest równe 3/7x plus wyraz wolny równy 1. Zrobione! Narysujmy to na wykresie. Wyraz wolny wynosi 1. Czyli jesteśmy tutaj. Nachylenie linii to 3/7. Przesuwając się o 7, rośniemy o 3. Inaczej, można też powiedzieć, że przesuwając się o 3.5 rośniemy o 1.5. Przesuwamy się o 1.5, o tutaj. A więc ta linia, jeśli chcemy ją narysowac, oczywiście zrobię to na oko, nie będzie to dokładna linia, powinna wyglądać tak. W rzeczywistości, nie będzie ona przebiegać dokładnie tędy, nie chcę byś odniósł takie wrażenie. Może więc będzie ona wyglądać jakoś tak. I ta linia, jak pokazaliśmy, minimalizuje kwadrat odległości od tych punktów do linii Swoją drogą, wyniki, przynajmniej tak mi się wydaje, okazały się całkiem ładne. .