Główna zawartość
Statystyka i prawdopodobieństwo
Kurs: Statystyka i prawdopodobieństwo > Rozdział 3
Lekcja 4: Wariancja i odchylenie standardowe w populacji- Miary rozrzutu danych: zakres, wariancja i odchylenie standardowe
- Wariancja populacji
- Odchylenie standardowe populacji
- Pojęcie rozproszenia i odchylenie standardowe
- Obliczanie odchylenia standardowego krok po kroku
- Odchylenie standardowe dla populacji
- Sprawdzenie zrozumienia: Odchylenie standardowe
- Statystyka: Alternatywne wzory na wariancję - film z polskimi napisami
© 2023 Khan AcademyWarunki użytkowaniapolitykę prywatnościInformacja o plikach cookie
Statystyka: Alternatywne wzory na wariancję - film z polskimi napisami
Wyjaśniamy inny wzór na wariancję oraz dlaczego on działa! Dla populacji wariancję liczy się ze wzoru σ² = ( Σ (x-μ)² ) / N. Inny równoważny wzór to σ² = ( (Σ x²) / N ) - μ². Jeśli musisz obliczyć wariancję ręcznie, ten alternatywny wzór może się okazać łatwiejszy do zastosowania. Stworzone przez: Sal Khan.
Chcesz dołączyć do dyskusji?
Na razie brak głosów w dyskusji
Transkrypcja filmu video
. Wydaję mi się, że nadszedł dobry czas, by pobawić się trochę wzorem na wariancję i zobaczyć, co z tego wyjdzie. I sądzę, że robiąc to uda nam się wyrobić trochę lepszą intuicję co do manipulacji notacji sigmowej albo nawet co do jej znaczenia. Dotąd nauczyliśmy się, wielokrotnie, że wzór na wariancję - i przyjmijmy, że robimy to dla wariancji populacji. że ten wzór jest prawie taki sam jak dla wariancji z próby. Po prostu dzielimy przez n, a nie n-1. Wariancja populacji wynosi... no, bierzemy każdy z punktów, x z indeksem i. Odejmujemy od tego średnią. Podnosimy do kwadratu. I potem bierzemy średnią tych wszystkich wyrazów. Czyli sumujemy kwadraty ogległości dla każdego z tych punktów od i równego 1 do i równego N. I dzielimy to przez N. Zobaczmy, co się stanie, jeśli... może zróbimy tak, wymnóżmy wyrazy w kwadracie i zobaczmy, dokąd nas to zawiedzie. To spójrzmy. I sądzę, że doprowadzi to nas do czegoś ciekawego. Zatem to jest to samo, co suma od i równego 1 do N z... no spójrzmy. To tu, to możemy po prostu wymnożyć. To jest to samo, co x z indeksem i do kwadratu minus... tu mamy trochę takiej algebry. Zatem, zamiast podnieść do kwadrat, to możemy po prostu to wymnożyć. Możemy to zapisać jako x z indeksem i minus Miu razy x z indeksem i minus Miu. To mamy x z indeksem i razy x z indeksem i. To jest x z indeksem i, do kwadratu. Potem mamy x z indeksem i razy miu... razy minus miu. i potem mamy minus miu razy x z indeksem i. Dodając te dwa otrzymujemy minus dwa x z indeksem i miu, prawda? Bo mamy to dwa razy. x z indeksem i razy miu. To jest raz minus x z indeksem i razy miu. A tu mamy drugie takie. Minus miu razy x z indeksem i. Dodając je, otrzymujemy minus 2 x z indeksem i miu Wiem, że to mylące lekko jak mówię z indeksem i itp Ale naprawdę, to niczym nie różni się jak robicie a minus b do kwadratu. Jedynie zmienne wyglądają... nieco bardziej skomplikowane. a ostatni czynnik to minus miu razy minus miu czyli plus miu do kwadratu. Dosyć zrozumiałe. Zmienię kolory, aby dalej wyglądało ciekawie. Pozwólcie, odseparuję to. Ok. To jak możemy... no, ta suma tego to jest to samo, co suma... ponieważ, pomyślcie, bierzemy każdego x z indeksem i. Dla każdej liczby w naszej populacji będziemy robić tę operację. I potem dodamy to wszystko. Ale jeśli o tym pomyślicie, to jest to to samo co... no jeśli nie jesteście zaznajomieni z notacją sigmową, to jest to rzecz, którą warto wiedzieć. Najpierw trochę intuicji. To jest to samo co - zrobię to tu, by mieć trochę miejsca. To jest to samo co suma od i równego 1 do N od z pierwszego czynnika, x z indeksem i do kwadratu minus... i możemy wyciągnąć te czynniki stałe. A sumując, jedyna rzecz, jaka sie liczy, to jest to coś co ma i-ty czynnik. W tym wypadku to x z indeksem i. Czyli x z indeksem 1, z indeksem 2. To te rzeczy trzeba zostawić na prawo od znaku sigmy. I jeśli zrobiliście listę filmików związaną z rachunkiem całkowym, to sigma jest tak naprawdę w pewnym sensie dyskretną całką... do pewnego stopnia. W całce sumujemy masę rzeczy. Mnożymy je przez dx, które jest bardzo malutkim przedzialkiem. Ale tutaj bierzemy po prostu sumę. I to jest to, o czym mówiłem w filmikach o całkowaniu, że całka to tak naprawdę w pewnym sensie taka nieskończona suma nieskończenie małych rzeczy ale nie chcę wpadać w dygresję. I to jest taki dłuższy sposób powiedzenia o tym drugim czynniku, że ta suma od i równego 1 do N z drugiego czynnika to to samo, co minus 2 razy miu razy suma od i równego 1 do N z x z indeksem i. I potem mamy plus. To jest zwyczajna stała, nie? Skoro to jest stała, to można ją wyciągnąć przed sumę. Mamy miu kwadrat razy suma od i równego 1 do N. A tu co będzie? To będzie po prostu 1, prawda? Właśnie podzieliliśmy jedynkę. Podzieliliśmy to przez 1 by wydostać się przed sigmę, przed ten znak sumy. Po czym zostaje nam tutaj tylko 1, prawda? Właściwie, mogliśmy zostawić to miu kwadrat. Ale wróćmy do upraszczania. No to mamy... tego naprawdę nie możemy zrobić. W sumie możmey... albo nie. Po prostu nie wiemy, jakie są każde z x z indeksem i. To zostawmy to tak jak jest. To mamy sumę... chwila! To jest licznik, prawda? To całe uproszczenie. Po prostu uprościliśmy licznik. A potem podzielimy to przez N. To to jest równe temu podzielonemu przez N. Co równa się temu czemuś podzielonemu przez N. Więc podzielę przez N na koniec. Bo licznik jest taki trochę mylący... prawda? Chcemy po prostu uprościć ten czynnik na górze. To róbmy to dalej. To mamy sumę od i równego 1 do N z x z indeksem i, do kwadratu. I spójrzmy. Minus 2 razy miu. Ops, przepraszam. To miu nie wygląda ładnie. Cofnijmy to. Minus 2 razy miu razy suma od i równego 1 do N z x i. A to tu to co? Jak inaczej można to zapisać? W sumie po prostu dodamy jedynkę N razy, racja? To tak jakby powiedzieć, że cokolwiek tu mamy, to powtarza się tak N razy. Gdybyśmy mieli tutaj x z indeksem i, to byśmy wzięli pierwszy x, potem drugi x i Ale jak mamy tutaj 1, to tak samo jak powiedzieć, że dodajemy 1 do siebie N razy, nie? A to jest równe N. To tu będzie plus miu kwadrat razy N. Dobra. To zobaczmy, czy da się jeszcze coś zrobić. Pamiętajmy, to tylko licznik. I wygląda póki co ok. Dodajemy każdy z tych czynników. I mamy minus 2 razy miu, nie? Od i równego 1 do... och. No pomyślmy. Co to? Co to jest, to tutaj? W sumie, wprowadźmy spowrotem to N. Zatem to tu to jest to, uproszczone do tego podzielonego przez N, co upraszcza się do tamtego czegoś. Co upraszcza się przez to tutaj podzielone przez N, nie? Co upraszcza się do tego tutaj podzielonego przez N. . Co jest tym samym jak dodanie każdego czynnika podzielonego przez N. Co jest równe tamtemu czemuś. A to jest równe temu. A to jest tym samym, co to, prawda? No więc, jak się to tu upraszcza? To jest już ciekawe. No to... hmm, nie wiele mogę zrobić. To się staje sumą od i równego 1 do N x z indeksem i do kwadratu podzielone przez N. No i to jest ciekawe. No to... jeśli wezmę każdy czynnik w mojej populacji i dodam je i podzielę przez N, to co to jest? Mówię o tym tutaj. Jeśli wezme wszystkie elementy z mojej populacji i podzielę je przez ich liczbę, to mamy średnią, czyż nie? To jest średnia mojej populacji. Zatem to jest też równe miu. To do czego to się upraszcza? Minus 2 razy co? Miu razy... to tutaj, co też jest miu. Czyli razy miu kwadrat, nie? Miu razy Miu. Czyli to jest średnia populacji. To było całkiem ładne uproszczenie. I potem plus... co my tu mamy? No spójrzmy. Tu mamy miu. I mamy N nad N. One się kasują. Czyli mamy po prostu miu kwadrat. To było też ładnym uproszczeniem. I potem to się upraszcza do... no, z tą stroną nie zrobimy już dużo. Zatem suma od i równego 1 do N z x z indeksem i do kwadratu nad N. I widzimy, że mamy minus 2 miu kwadrat plus miu kwadrat. To to samo, co minus miu kwadrat, nie? Czyli minus średnia kwadrat. No to mamy już całkiem ładny sposób zapisania wariancji, nie? Można w sumie wziać średnią kwadratów wszystkich liczby w naszej, w tym wypadku, populacji. I potem odjąć od tego średnią populacji... średnią kwadrat populacji. Więc, w zależności od tego, jak liczymy, to może okazać się nieco szybszym sposobem liczenia wiariancji. Zatem bawiąc się trochę algebrą, uzyskaliśmy z tego, gdzie trzeba za każdym razem wziąć punkty danych odjąć średnią od nich podnieść do kwadratu. I oczywiście trzeba wcześniej policzyć samą średnią. No to bierzemy te kwadrat, sumujemy je i potem bierzemy średnią, czyli bierzemy tę sumę i dzielimy przez N. I to uprościliśmy, z pomocą drobiny algebry, do tego wzoru. I to jest... dochodzimy do czegoś zwanego wynikami surowymi. Co chcemy zrobić to napisać to tu w terminach samych x i. I jesteśmy w czymś, co się zwie metodą surowych wyników. Co jest częstokroć szybszym sposobem liczenia wariancji. To zobaczmy. Czemu równa się miu? Co to jest średnia? Średnia równa się sumie od i równego 1 do N z każdego czynnika, nie? Bierzemy po prostu sumę każdego z nich i dzielimy przez ich liczbę, tak? To spójrzmy na to tutaj. To tu może być zapisane jako... narysuję linię tu. To tu może być napisane jako suma od i równego 1 do N z x z indeksem i do kwadratu. I to wszystko nad N. Minus miu kwadrat. A miu to jest to. Czyli to do kwadratu. A to do kwadratu to jest...? To jest x z indeksem i, bierzemy tego sumę, do N. i równa się 1. I weźmiemy kwadrat tego czegoś. I potem podzielimy to, co podnieśliśmy do kwadratu przez N do kwadratu. I to wydaję mi się najprostsza forma z tych wszystkich wzorów, tak moim zdaniem. Gdzie praktycznie po prostu bierzemy... zakładając, że znamy średnią, nie? No to Ok. Moja średnia to jest coś, ja to coś podniosę do kwadratu i odłożę tak na chwilkę. Ale wpierw, to mogę wziąć każdą z liczb, podniśc do kwadratu, zsumować je i podzielić przez całkowitą liczbę liczb, jaką mam, nie? Czy ja może zapisałem to gdzieś... nie. Wymazałem ostatni zestaw liczb jaki miałem. Ale można sprawdzić, że dojdziemy do tej samej wariancji. Więc dla mnie to jest prawie najprostszy wzór. Ale ten jest jeszcze szybszy na wiele sposobów, bo nie trzeba nawet policzyć średniej zawczasu. Można po prostu wziąć każdego z x i i wykonąć tą tu operację. I potem podzielić przez N kwadrat albo przez N i również dojść do wariancji. Nie trzeba tego policzyć zanim się dojdzie do całej wariancji. No ale pomyślałem sobie, że to będzie całkiem pouczające I mam nadzieję, że macie trochę więcej intuicji, co do sposobu działania znaku sigmy. Skoro wyliczyliśmy te inne sposoby zapisania wariancji. I szczerze, niektóre książki po prostu powiedzą o hej, wiecie co? Wariancja może być zapisana tak i chodzi nam o wariancję populacji albo może być zapisana tak. Albo nawet tak. I dobrze jednak jest wiedzieć, że można trochę samemu algebrą się pobawić i przejść z jednej formy do drugiej. No i czas się mi skończył. Do zobaczenia w następnym filmiku! Fin.