If you're seeing this message, it means we're having trouble loading external resources on our website.

Jeżeli jesteś za filtrem sieci web, prosimy, upewnij się, że domeny *.kastatic.org i *.kasandbox.org są odblokowane.

Główna zawartość

Kwadrat błędu linii regresji

Wprowadzenie do pomysłu, który polega na tym, że możemy znaleźć linię, która minimalizuje kwadratowe odległości od linii do punktów. Stworzone przez: Sal Khan.

Chcesz dołączyć do dyskusji?

Na razie brak głosów w dyskusji
Rozumiesz angielski? Kliknij tutaj, aby zobaczyć więcej dyskusji na angielskiej wersji strony Khan Academy.

Transkrypcja filmu video

. W kilku kolejnych filmach chciałbym zatrzymać się na czymś co pozwoli nam dojść do wyniku, który jest łatwy do zastosowania. W trakcie większości zajęć ze statystyki zobaczysz wyłącznie wynik końcowy. Tymczasem ja chciałbym pokazać jak do niego dojść. Ale muszę Cię uprzedzić już teraz. Pojawi się sporo trudnej matematyki, głównie algebry. Będziemy musieli wykorzystać też nieco analizy matematycznej w końcówce. Będziemy musieli policzyć kilka pochodnych cząstkowych. Więc jeśli brzmi to zniechęcająco, jeśli sądzisz że może Cię to zniechęcić w jakiś sposób, nie musisz tego oglądać. Możesz przewinąć na koniec i zobaczyć wzór do którego zamierzamy dojść. Jednak, moim zdaniem, można osiągnąć sporo satysfakcji wyznaczając go. A więc, to czym będziemy się tu zajmowąc, to sytuacja gdy mamy n punktów w układzie współrzędnych Nie ma wymogu by wszystkie leżały w pierwszej ćwiartce. Ale dla ułatwienia prezentacji, narysuje je właśnie w pierwszej ćwiartce. Powiedzmy więc, że mam punkt tutaj, narysuje je innym kolorem, Powiedzmy więc, że mam punkt tutaj, jego współrzędne to x1,y1. I powiedzmy, że kolejny punkt znajduje się tutaj. . Ze współrzędnymi x2, y2. Mogę kontynuować dodawanie punktów. I rysować je dalej. Mielibyśmy wiele punktów Tu, tam i tam, i rysowalibyśmy aż do n-tego punktu . Który może byłby tutaj nazwiemy go xn,yn A więc mamy n punktów. Nie narysowałem wszystkich punktów. Ale chciałbym znaleźć linię prostą, która minimalizuje kwadrat odległości od tych punktów. Pomyślmy o tym, wyobraźmy sobię tę linię. Będziemy mieli linię, Spróbuję narysować linię która przybliża rozmieszczenie tych punktów Narysuję ją tutaj. Linia mogłaby wyglądać mniej więcej tak. Spróbuję przybliżyć ją najlepiej jak potrafię. Ok, narysujmy ją nieco inaczej. Może powinna wyglądać mniej więcej tak. W tym momencie nawet nie wiem jak ta linia powinna wyglądać. To co chcemy zrobić to zminimalizować kwadrat błędu, odległości od każdego z tych punktów do linii. Pomyślmy co to oznacza. Jeśli równanie tej liczby to y równe mx+b wiemy to z algebry 1. To jest nachylenie linii, a to jest wyraz wolny To jest punkt (0,b) To co chciałbym zrobić, co będzie tematem kolejnych kilku filmów, to znaleźć wartości m i b. Chciałbym znaleźć te 2 rzeczy definiujące prostą tak by minimalizowany był błąd kwadratowy. Zdefiniujmy ten błąd. Dla każdego punktu błąd pomiędzy nim i linią to ta pionowa odległość. To tutaj możemy nazwać błędem 1. . A to tutaj będzie błędem 2. Pionowa odległość między tym punktem i linią prostą. Możesz o tym myśleć jako o wartości y w tym punkcie i wartości y na prostej. i tak dalej, aż do ostatniego punktu odległość między wartością y punktu i wartością y linii prostej. Czyli ten błąd tutaj, błąd 1, jeśli wolisz, dla tej wartości y jest równy y1 minus wartość y. Ile wynosi wartość y w tym miejscu? x wynosi tu x1. A ten punkt to m x1 + b Jeśli wstawisz x1 do równania prostej dostaniesz punkt dokładnie tutaj. ta wartość wyniesie dokładnie m x1+b To jest wspomniany pierwszy błąd. I możemy liczyć to dalej dla kolejnych punktów. Błąd tutaj wynosi y2 minus (m x2 plus b) Ten punkt tutaj to m x2 + b wartość na prostej w punkcie x2. I tak dalej, aż do punktu n. Ten błąd tutaj to yn - (m xn +b). Teraz, gdybyśmy chcieli po prostu zsumować błędy, moglibyśmy po prostu dodać kolejne liczby. To co jednak chcielibyśmy zrobić to zminimalizować kwadrat błędu pomiędzy każdym punktem, każdym z n punktów, a linią prostą. Zdefiniujmy więc błąd kwadratowy względem linii jako równy sumie kwadratów kwadratów tych błedów. Czyli ten błąd tutaj,który nazwaliśmy błędem 1, to y1 minus (m x1 plus b). Podniesiemy to do kwadratu. I tak otrzymujemy kwadrat błędu 1. Dalej obliczymy kwadrat błędu 2. Błąd 2 czyli y2 minus (m x2 plus b) i teraz podnosimy to do kwadratu. i tak dalej, przez n pól, czy raczej n punktów. Kontynuujemy aż do n-tego błędu. n-ty błąd to yn minus (m xn plus b). Podnosimy go do kwadratu . A więc to jest kwadrat błędu względem prostej. W kolejnych filmach, będę szukał m i b które minimalizują błąd kwadratowy tej linii tutaj. Jeśli uważasz, że to dobra miara jakości dopasowania linii prostej, to dalej będziemy szukać najlepiej dopasowanej linii do tych punktów. Kontynuuować temat będę w kolejnym filmie. Ponieważ myślę, że przy trudniejszych zagadnieniach matematycznych dobrze jest wprowadzać tylko jeden koncept w danym czasie. to pozwala również zminimalizować prawdopodobieństwo, że popełnię błąd. .