If you're seeing this message, it means we're having trouble loading external resources on our website.

Jeżeli jesteś za filtrem sieci web, prosimy, upewnij się, że domeny *.kastatic.org i *.kasandbox.org są odblokowane.

Główna zawartość

Prawo wielkich liczb

Jaka magia stoi za prawem wielkich liczb? Stworzone przez: Sal Khan.

Transkrypcja filmu video

Zajmijmy się Prawem wielkich liczb, które z wielu względów jest jednym z najbardziej intuicyjnych praw w matematyce i teorii prawdopodobieństwa. Ze względu na to, że da się je zastosować do tak wielu rzeczy, jest to często używane w niewłaściwy sposób prawo, nieco niezrozumiane. Dla zachowania odrobiny formalności w naszych matematycznych rozważaniach zdefiniujmy sobie parę rzeczy na początku, a później porozmawiamy odrobinę o intuicji. Powiedzmy, że mamy zmienną losową X. I znamy jej wartość oczekiwaną lub średnią populacji. Prawo wielkich liczb mówi, że jeżeli weźmiemy próbę n obserwacji naszej zmiennej losowej i uśrednimy te wszystkie obserwacje-- pozwólcie, że zdefiniuje kolejną zmienną. Nazwijmy ją X_n z kreską nad. To jest średnia n obserwacji naszej zmiennej losowej. Czyli bierzemy po kolei, pierwszą obserwację. Przeprowadzamy eksperyment raz i otrzymuję tą obserwację, kolejny eksperyment - kolejna obserwacja Przeprowadzam je kolejno n razy i później dzielę przez liczbę moich obserwacji. To jest średnia mojej próby. To jest średnia wszystkich obserwacji, które dokonałem. Prawo wielkich liczb mówi, że średnia mojej próby będzie zbliżała się do wartości oczekiwanej zmiennej losowej. Mogą zapisać to również jako, że średnia mojej próby będzie zbliżać się do średniej populacji dla n dążącego do nieskończoności. Korzystam w nieco nieformalny sposób ze stwierdzeń "dąży do.." czy też pojęcia zbieżności ogólnie. Ale wydaje mi się, że macie ogólne poczucie tego że jeżeli wezmę tutaj wystarczającą dużą próbę to uda mi się uzyskać wartość oczekiwaną dla całej populacji. Wydaje mi się, że dla większość z nas jest to całkiem intuicyjne. Jeżeli dokonam wystarczającej ilości prób, to dostanę liczby, których spodziewałbym się znając wartość oczekiwaną, rozkład prawdopodobieństwa i to wszystko. Wydaje mi się, że jest to prawo trochę źle zrozumiane pod kątem tego, dlaczego tak się właśnie dzieje. I zanim się w to zagłebimy, pozwólcie że pokażę wam konkretny przykład. Prawo wielkich liczb mówi nam jedynie -- powiedzmy, że mam zmienną losową -- X jest równa liczbie reszek po 100 rzutach uczciwą monetą -- rzutów uczciwą monetą. Po pierwsze, wiemy jaka jest wartość oczekiwana tej zmiennej losowej. Jest to liczba rzutów, liczba prób pomnożona przez prawdopodobieństwo sukcesu w dowolnym z rzutów. Jest równa 50. Prawo wielkich liczb mówi, że jeżeli wzięlibyśmy próbę lub jeżeli uśrednilibyśmy próbę składającą się z kilku tych rzutów... Powiedzmy, że za pierwszym razem gdy przeprowadzam tą próbę rzucam po kolei 100 monetami lub mam 100 monet w pudełku po butach i trzęsę pudełkiem, później zliczam liczbę reszek i wychodzi 55. To będzie x1. Później znowu trzęsę pudełkiem i otrzymuję 65. Znowu trzęsę i wychodzi 45. Robię to n razy i później dzielę przez liczbę wykonanych prób. Prawo wielkich liczb mówi nam jedynie tyle, że ta średnia wszystkich moich obserwacji, będzie zmierzać do 50 wraz z n zmierzającym do nie skończoności. Lub dla n zmierzającego do 50. Przepraszam, n zmierzającego do nieskończoności. I chciałbym zająć się tym dlaczego tak właściwie się dzieje lub intuicyjnie dlaczego tak jest. Wiele osób myśli, że jeżeli po 100 próbach jestem nieco powyżej średniej to znaczy, że z praw prawdopodobieństwa wynika, że będę uzyskiwał więcej reszek lub przeciwnie - mniej reszek, by nadrobić różnicę. Wcale nie o o to chodzi. Takie myślenie wiąże się z tzw. paradoksem hazardzisty. Pozwólcie, że pokażę gdzie tkwi różnica. Użyję ponownie tego przykładu. Powiedzmy -- pozwólcie, że narysuję graf. I zmienię kolory. To jest n - moją osią x jest n. To jest liczba prób, które wykonałem. I moja oś y, będzie równa średniej próby. Wiemy ile wynosi wartość oczekiwana, wiemy że wartość oczekiwana tej zmiennej losowej wynosi 50. Pozwólcie, że narysuję tutaj. To jest 50. Wracając do przykładu, którym się zajmowałem. Gdy n jest równe -- pozwólcie, że narysuję tutaj. Z mojej pierwszej próby mam wynik: 55 i to była moja średnia, gdy miałem tylko jeden punkt. Po dwóch próbach, popatrzmy, uzyskałem wynik 65. Moja średnia będzie wynosi 65 + 55, podzielone przez 2. Co daje 60. Wtedy moja średnia poszła nieco w góre. Później uzyskałem wynik 45, który zmniejszył nieco moją średnią. Nie będę rysował tutaj 45. Muszę teraz uśrednić te wszystkie wyniki. Ile to jest 45 + 65? Pozwólcie, że to wyliczę tak żebyśmy uzyskali kolejny punkt. To jest 55 + 65. To jest 120 + 45, łącznie 165. Podzielone przez 3. 3 mieści się w 165, 5 razy - 5 razy 3 daje 15. To będzie 53. Nie, nie, nie. 55. Czyli średnia spada do 55. Możemy kontynuować wykonywanie kolejnych prób. Możesz powiedzieć, że prawo wielkich liczb mówi, OK, jesteśmy po wykonaniu 3 prób i mamy tutaj naszą średnią. Wiele osób myśli, że w pewien sposób bogowie prawdopodobieństwa sprawią, że będzie bardziej prawdopodobne, że uzyskamy mniejsze ilości reszek w przyszłych rzutach. W pewien sposób następne kilka prób musi mieć mniejszą liczbę oczek, by zmniejszyć naszą średnią. Wcale tak nie musi być. Kontynuując, kolejne próby są dokładnie takie same. Prawdopodobieństwo wyrzucenia reszki ciągle wynosi 50%. Wcale nie wynika stąd, że jeżeli wyrzucałem bardzo dużo reszek na początku, a przynajmniej więcej niż oczekiwałem, to nagle rzeczywistość będzie starała się nadrobić i będę uzyskiwał więcej orzełków. To byłby wspomniany paradoks hazardzisty. To oczekiwanie, że jeżeli mamy długą serię reszek lub jeżeli mamy nadwyżkę reszek, to w pewnym momencie będziemy mieć większe prawdopodobieństwo uzyskania nieproporcjonalnie większej liczby orzełków. Nie jest to prawdą. To o czym mówi nam prawo wielkich liczb, jest mu obojętne.. Powiedzmy, że po pewnej skończonej liczbie prób Nasza średnia -- jest małe prawdopodobieństwo takiego ciągu, ale powiedzmy, że nasza średnia znajduje się tutaj. Wynosi 70. Mocno odbiegliśmy od wartości oczekiwanej. Prawo wielkich liczb mówi: "Cóż, nie dbam ile prób było dotąd. Zostaje nam jeszcze nieskończona ilość prób do wykonania." I wartość oczekiwana dla tej nieskończonej liczby prób, w tej szczególnej sytuacji będzie równa 50. Jeżeli więc uśrednimy skończoną liczbę prób, z której uzyskamy wysoką średnią, to w <i>nieskończonym</i> ciągu prób wartość będzie wraz z czasem stopniowo zbiegać się do wartości oczekiwanej. Jest to mało formalny sposób opisu, ale właśnie o tym mówi nam prawo wielkich liczb. I jest to ważna rzecz. Nie mówi nam, że jeżeli wyrzucimy dużo reszek to nagle zwiększy się prawdopodobieństwo wyrzucenia orzełka, by nadrobić za wyrzucone reszki. Mówi nam, że niezależnie co się stało w skończonym ciągu prób, niezależnie od średniej uzyskanej po skończonej liczbie prób, mamy jeszcze do wykonanie nieskończoną liczbę prób. I jeżeli wykonamy wystarczająco wiele, średnia zbiegnie się z powrotem do naszej wartości oczekiwanej. I jest to coś naprawdę ważnego. Gracze nie korzystają się z tej wiedzy na co dzień w loteriach i kasynach. Ponieważ wiadomo, że jeżeli weźmiemy wystarczająco duże próby i możemy nawet wyliczyć, jeżeli weźmiemy wystarczająco duże próby, jakie będzie prawdopodobieństwo znacznego odchylenia? Ale kasyna i loterie opierają się na tej zasadzie, jeżeli zbierze się wystarczająco dużo osób -- oczywiście, na krótką metę lub jedynie opierając się na kilku próbach kilku osobom uda się rozbić bank. Ale na dłuższą metę kasyno zawsze wyjdzie na swoje, dzięki odpowiednio ustawionym parametrom gier w które się gra. Niemniej jednak jest to ważna rzecz w prawdopodobieństwie i myślę, ze jest całkiem intuicyjna. Czasem jednak gdy widzi się ją wyjaśnioną formalnie tak jak tutaj, ze zmiennymi losowymi, może się wydawać nieco myląca. Prawo mówi nam jedynie, że w miarę zbierania coraz większej liczby prób, średnia z tych prób będzie przybliżać coraz lepiej prawdziwą średnią. Lub będąc nieco dokładniejszym: średnia naszych prób będzie zbiegać się do prawdziwej średniej całej populacji lub wartości oczekiwanej zmiennej losowej. Do zobaczenia w następnym filmie.