If you're seeing this message, it means we're having trouble loading external resources on our website.

Jeżeli jesteś za filtrem sieci web, prosimy, upewnij się, że domeny *.kastatic.org i *.kasandbox.org są odblokowane.

Główna zawartość

Dedukcja średniej populacji z średniej próby

Wiele statystyk opiera się na danych z próbki losowej, która reprezentuje populację jako całość. Ze średniej tej próbki możemy dojść do wniosków dotyczących średniej większej populacji. Wytłumaczymy to. Stworzone przez: Sal Khan.

Chcesz dołączyć do dyskusji?

Na razie brak głosów w dyskusji
Rozumiesz angielski? Kliknij tutaj, aby zobaczyć więcej dyskusji na angielskiej wersji strony Khan Academy.

Transkrypcja filmu video

Załóżmy, że chcesz zaprojektować produkt dla mężczyzn. Taki, który zależy od wysokości. Produkt ma być wypuszczony na rynku USA. Przydałaby się nam wiedza o tym jaka jest średnia wysokość mężczyzn w USA. Zapiszę. Średnia wysokość mężczyzn w USA. Jak obliczylibyśmy tą wartość? Gdy mówię o średniej wysokości, to posługuję się średnią arytmetyczną. Jeżeli miałbym na myśli inny rodzaj średniej, na przykład średnią geometryczną, to powiedziałbym to otwarcie. Jeżeli ludzie mówią "średnia" to zazwyczaj mają na myśli średnią arytmetyczną. Jak zabralibyśmy się do obliczenia średniej wysokości mężczyzn w USA? Cóż, możemy po prostu poprosić każdego mężczyznę w USA, by zmierzył swoją wysokość i nam ją podał. Następnie moglibyśmy je zsumować i podzielić przez ilość mężczyzn w USA. Musimy jednak zadać sobie pytanie czy takie działanie jest praktyczne? Mamy mniej więcej 300 milionów ludzi w USA, połowę z nich stanowią mężczyźni. Mamy w przybliżeniu 150 milionów mężczyzn w USA. Jeżeli chcielibyśmy poznać prawdziwą wartość średnią wysokości wszystkich mężczyzn w USA musielibyśmy dokonać ankiety... co ja mówię, nie tylko ankietować ale własnoręcznie pomierzyć wszystkie 150 milionów mężczyzn. Nawet jeżeli spróbowalibyśmy, to zanim skończylibyśmy mierzyć to wiele z tych mężczyzn umrze i wiele się urodzi. Przez co nasze dane natychmiastowo się zestarzeją. Wydaje się to być niemożliwe albo prawie niemożliwe by w momencie poznać wysokość każdego z mężczyzn w USA. Zamiast tego możemy popatrzeć bardziej realistycznie. Nie możemy poznać wysokości każdego z mężczyzn, ale być może mogę pobrać próbę spośród wszystkich mężczyzn. I postaram się by było to możliwie losowa próba. Nie chciałbym wyciągnąć z całości 100 osób, które grały w koszykówkę albo siatkówkę w szkole średniej. Chcę losowej próby,być może pierwsze osoby, które wyjdą z galerii handlowej zbierane z kilku miast. Osoby wybierane według jakiegoś kryterium, które nie jest związane z wysokością. Na które wysokość nie ma wyraźnego wpływu. Pobieramy z całości próbę i jej podstawie obliczamy średnią. Na pewno jest to średnia tej próby i mamy nadzieję, że jest reprezentatywna dla całej populacji. Oczywiście jeżeli była to wystarczająco duża i losowa próba. Mamy nadzieję, że średnia próby będzie dobrze przybliżać średnią całej populacji. Zauważycie, że w większości statystyki chodzi o to, by wykorzystać to wiemy lub możemy obliczyć odnośnie próby, by wnioskować na temat całości populacji. Ponieważ nie możemy bezpośrednio dokonywać pomiarów na całości populacji. Wypróbujmy to na przykładzie. Jeżeli chcielibyśmy wziąć się na to poważnie, to poleciłbym wam zebrać przynajmniej 100 lub 1000 punktów pomiarowych jako próbę. W następnych filmach opowiem nieco więcej o kryteriach mówiących kiedy mamy już wystarczająco dużo punktów pomiarowych, lub mamy wystarczająco dużą pewność co do naszego wyniku. Załóżmy jednak, że jesteśmy trochę leniwi i zebraliśmy wysokości od 5 mężczyzn. 6.2 stopy, 5.5 stopy, 5.75 stopy,6.3 stopy i 5.9 stopy. Jeżeli to są wysokości, które udało się nam uzyskać, to jaka będzie średnia wysokości dla tej próby? Wyciągnijmy kalkulator. 6.2 + 5.5 + 5.75 + 6.3 + 5.9. Suma wynosi 29.65 i chcemy podzielić przez liczbę zebranych punktów pomiarowych. Podzielmy 29.65 przez 5. Uzyskujemy 5.93 stopy. Średnia dla naszej próby, oznaczę ją x z kreską. Średnia wynosi 5.93 stopy. To jest nasza średnia próby. Średnia arytmetyczna z próby. W momencie, gdy przeprowadzamy to obliczenia, opierające się na pobranej przez nas próbie i chcemy na ich podstawie estymować wartość średniej dla całej populacji, nazywamy to wszystko statystyką. Możecie teraz spytać jakiej notacji używamy, gdy jesteśmy w stanie zmierzyć wartość dla całej populacji? Załóżmy nawet, że nie jesteśmy w stanie tego zrobić, ale chcemy przynajmniej jakoś oznaczyć średnią populacji. Średnia populacji jest najczęściej oznaczana przy pomocy greckiej litery μ (mi). W statystyce często obliczamy średnią z próby by oszacować tą wartość, której możemy nie znać. Czasem możemy przeprowadzić obliczenia na całej populacji, a czasem jest to niemożliwe. Te wartości nazywamy parametrami. Zauważycie w statystyce, że chodzi głównie o obliczenie statystyk dla prób po to by oszacować parametry dla całej populacji. Ostatnią rzeczą, którą chciałbym zrobić w tym filmie, to wprowadzić was w odrobinę notacji wykorzystywanej w podręcznikach do statystyki. Notacji, które może nieco zniechęcać swoim wyglądem. Mam nadzieję, że po kilku minutach docenicie, że oznacza ona po prostu to czym do tej pory się zajmowaliśmy. Dodawanie do siebie liczb i dzielenie przez ilość zsumowanych liczb. Jeżeli chcielibyśmy obliczyć średnią dla populacji to robilibyśmy to samo, tylko dla znacznie większej ilości osób. Musielibyśmy dodać 150 milionów liczb i podzielić przez 150 milionów. W jaki sposób matematycy mówią o takiej operacji? Dodawaniu do siebie liczb i dzieleniu przez ilość dodanych liczb. Pomyślmy najpierw o średniej próby, ponieważ to dla niej dokonaliśmy obliczeń. Matematyk może nadać każdej z tych liczb nazwę i indeks. To będzie x1, x2, x3. Liczby znajdują się w indeksie dolnym. x4 i x5. Jeżeli mielibyśmy n takich liczb, to kontynuując mielibyśmy x6, x7 aż do xn. Średnia próby jest równa sumie wszystkich Xi, możemy sobie wyobrazić, że te "i" będą się zmieniać. Będą przyjmować wartości od 1 do rozmiaru naszej próby, czyli do n. W naszym przypadku n jest równe 5. To mówi dokładnie tyle co: x1 + x2 + x3, aż do + xn. Znów, w naszym przypadku n = 5. Teraz, czy już skończyliśmy? Czy to jest właśnie średnia próby? Jeszcze nie! Naszym zadaniem nie jest zwykłe posumowanie wartości punktów pomiarowych, musimy jeszcze podzielić przez ich ilość. Musimy podzielić przez ilość punktów pomiarowych. Wygląda to na bardzo skomplikowaną notację, mówi to nam jedynie "posumuj punkty pomiarowe i podziel przez ich ilość". Ta duża litera Σ (sigma) oznacza sumę. Suma wszystkich Xi od x1 do xn i podziel przez liczbę posiadanych punktów pomiarowych. Pomyślmy teraz jak zapisalibyśmy to samo dla średniej populacji. Średnią populacji oznaczamy przez μ. Znów będziemy brać sumę, tym razem będziemy sumować po wszystkich elementach populacji. Czyli Xi, znów zaczynamy od i równego 1. Tym razem chcemy oznaczyć, że liczymy dla całej populacji, więc będziemy oznaczać to przez duże N. Co ma oznaczać, że ta liczba jest znacznie większa od tej oznaczanej przez małe n. Ale znów, to nie wszystko. Musimy podzielić przez ilość sumowanych punktów pomiarowych. To jest to samo co x1 + x2 + x3 aż do xN, to wszystko podzielone przez N. W naszej sytuacji, obliczenie tego jest jest możliwe, obliczenie tego jest bardzo trudne. Możemy debatować, czy wybraliśmy wystarczająco ilość punktów do naszej próby, ale mamy nadzieję że w pewien sposób przybliża to średnią populacji.