Forum strony www.multipasko.pl [Regulamin]


Dodaj wpis w tym temacie
Spis tematów
Login:

Hasło:
Strona: 1
Wyślij wiadomość do admina

Przewiń wpisy ↓

Test serii - czym jest (przykład)

2015-10-23 (23:21)

status unhappy
Data rejestracji: 2013-01-22
Ilość postów: 359

13716
wpis nr 938 929
[ CZCIONKA SPECJALNA ]

W oddzielnym wątku posłużyłem się testem serii, ale być może nie każdy zrozumie z opisu na Wikipedii, czym jest i po co się go stosuje.



Poniżej zamieszczam więc przykład "z naszego podwórka", tzn. oparty na 50 ostatnich wynikach gry Lotto. Załóżmy, że ściągnęliśmy sobie wyniki tych 50 losowań i zadajemy sobie następujące pytania (pomijam, czy są sensowne i czemuś służą - to ma być tylko przykład):



1) Czy najniższa liczba wylosowana w danym losowaniu wybierana jest losowo (patrzymy tylko na ciąg pierwszych liczb w uporządkowanych wynikach)?



2) Czy najwyższa liczba wylosowana w danym losowaniu wybierana jest losowo (patrzymy tylko na ciąg ostatnich liczb w uporządkowanych wynikach)?



3) Czy suma wszystkich liczb wylosowanych w danym losowaniu układa się w ciąg, o którym możemy powiedzieć, że ma charakter losowy.



Co robimy?



1) Ściągamy wyniki, wyznaczamy interesujące nas miary (MIN, MAX, SUMA)



2) Wyznaczamy medianę dla każdego z trzech tak utworzonych szeregów



3) Tworzymy serie w trzech kolejnych kolumnach (S1, S2, S3) w sposób opisany na poniższym rysunku (patrz formuły):







W zasadzie powinniśmy jeszcze wyrzucić wyniki równe medianie, co można zrobić albo ręcznie, albo przez zagnieżdżenie funkcji JEŻELI.



4) Wyznaczamy:



- runs (na Wikipedii oznaczane jako k): liczba serii, tzn. liczba naprzemiennie występujących ciągów TYCH SAMYCH ZNAKÓW (u mnie są to 0 i 1) - w Excelu można to policzyć bardzo łatwo przez porównanie w oddzielnej kolumnie dwóch sąsiednich komórek w w każdej z kolumn S1, S2 i S3 i ustawienie 1 gdy są różne, 0 gdy są równe - na koniec sumujemy wartość takiej kolumny



- n1 i n2: liczba - odpowiednio - zer i jedynek w każdym z ciągów S1, S2, S3 - w Excelu liczy się łatwo przez użycie funkcji LICZ.JEŻELI



- wyznaczenie statystyki testowej Z - trzeba po prostu przepisać wzór z Wikipedii (w wersji dla szeregu o liczebności >20, bo mamy 50 obserwacji)



- skorzystać z tablic wartości krytycznych dla testu dwustronnego (lub jednostronnego, jeśli interesuje nas badanie trendów) - jest w Wikiźródłach - lub wyliczyć wartość krytyczną w Excelu, podaję przykład dla poziomu istotności alfa = 0,05:







Dla poziomu istotności alfa = 0,1 jest podobnie (dlatego w wątku dot. ciekawostek Lotto napisałem, że drugi test został zdany "na granicy", bo p-value, czyli w uproszczeniu "graniczne" alfa, które jeszcze mogłem zaakceptować, jest właśnie bliskie 0,1):







5) Porównujemy wartość Z z wartościami krytycznymi; jeżeli jest mniejsza od niższej z nich lub większa od wyższej, musimy odrzucić hipotezę o losowości na korzyść alternatywnej (przy teście dwustronnym jest to hipoteza o braku losowości)



Ot, i cała filozofia.



Ja upraszczam sobie zadanie i korzystam z implementacji testu w innym programie niż Excel, dlatego nie patrzę na wartości krytyczne, tylko na p-value, co na jedno wychodzi (w polskich podręcznikach autorzy wolą liczyć wartości krytyczne, w zachodnich opierają wnioski na p-value).



Jakie więc ten test (właściwie trzy testy) daje wyniki?



Dla szeregu S1:







Wniosek: szereg najniższych liczb nie układa się losowo



Dla szeregu S2:







Wniosek: szereg najwyższych liczb układa się losowo



Dla szeregu S3:







Wniosek: szereg sum układa się losowo



>The End<
2015-10-24 (00:40)

status ralfek
Data rejestracji: 2009-07-08
Ilość postów: 3863

4876
wpis nr 938 937
[ CZCIONKA SPECJALNA ]

Powiedz mi jedną teoretyczną rzecz,



załóżmy, że bierzesz sobie 50 ostatnich losowań jakiejś bazy i oglądasz.. okazuje się, że we wszystkich najniższa wylosowana liczba to 1, a reszta liczb jest różna



Czy losowania mają zachowaną losowość?



Z niecierpliwością czekam na odpowiedź

--- wpis edytowano 2015-10-24 00:41 ---

2015-10-24 (00:57)

status unhappy
Data rejestracji: 2013-01-22
Ilość postów: 359

13716
wpis nr 938 940
[ CZCIONKA SPECJALNA ]

Nie udzielę Ci odpowiedzi na źle (nieprecyzyjnie) sformułowane pytanie. Przykro mi.

--- wpis edytowano 2015-10-24 01:00 ---

2015-10-24 (00:58)

status ralfek
Data rejestracji: 2009-07-08
Ilość postów: 3863

4876
wpis nr 938 941
[ CZCIONKA SPECJALNA ]

Przepraszam, pytanie miało być czy pierwsze liczby w losowaniach są losowe (te jedynki), tak jak w twoim teście

--- wpis edytowano 2015-10-24 00:58 ---

2015-10-24 (01:15)

status unhappy
Data rejestracji: 2013-01-22
Ilość postów: 359

13716
wpis nr 938 944
[ CZCIONKA SPECJALNA ]

Teraz lepiej



Tylko że muszę zapytać, po co chcesz przykładać (jakikolwiek) test losowości do ciągu, który nie wykazuje żadnej zmienności? Losowość rozumiana jako brak porządku czy niemożność przewidzenia wyniku (oczywiście w poważnych zastosowaniach trzeba to dookreślić) z góry każe zakwalifikować taki ciąg jako deterministyczny (przewidywalny).



Z formalnego punktu widzenia będziesz tu miał tylko jedną serię. Znacznie ciekawszy (a również utrzymany w duchu: "spróbuję zadać pytanie o przypadek skrajny") jest przypadek naprzemiennie pojawiających się 0 i 1... Ten ciąg już wykazuje jakąś zmienność, więc pytanie o losowość można postawić... Co odpowie nam wtedy test?







Czyli odrzucamy hipotezę o losowości: test wykrył powtarzalność (porządek), której nie da się pogodzić z losowością, nawet braną tylko na tzw. zdrowy rozsądek (czyli w oparciu o powyższą, nieprecyzyjną definicję)...
2015-10-24 (01:23)

status ralfek
Data rejestracji: 2009-07-08
Ilość postów: 3863

4876
wpis nr 938 945
[ CZCIONKA SPECJALNA ]

Chciałem sprawdzić czy zapytasz o konspekt tych 50 losowań teoretycznych



Nie zapytałeś, więc mówię, te hipotetyczne losowania są z gry wymyślonej przeze mnie na potrzeby tematu. W tej grze było już miliard losowań. Teoria wielkichliczb jeśli się nie mylę, najbardziej zaniedbana dziedzina matmy lub ukrywana.. kto wie?



Mając miliard losowań, czy to, że w ostatnich 50 w każdym padłą jedynka jako pierwsza liczba oznacza, że losowania są ustawione?



Oczywiście, że nie. Moim zdaniem i zdaniem najnowszej nauki masz błędne podejście do pojęcia losowości, masz raczej na myśli chaos, nie losowość.



Nie ma podstaw by twierdzić, że rzucając 50 razy monetą nie wypadnie ciągle na przemian 1, 0



Pewien naukowiec siedział kilka dni przed kamerą i tak długo rzucał monetą aż pod rząd trafił bardzo dużo reszek (czy tam orłów)



powiedz mu, ze manipulował rzucaniem.. nie manipulował (mozna to obejrzec na jutubie), po prostu zdarzenie tak rzadkie jest możliwe w każdym momencie istnienia wszechświata.

--- wpis edytowano 2015-10-24 01:23 ---

2015-10-24 (02:38)

status unhappy
Data rejestracji: 2013-01-22
Ilość postów: 359

13716
wpis nr 938 947
[ CZCIONKA SPECJALNA ]

Ralfek, wybacz, ale nie jest moim celem roztrząsanie natury zjawisk nieprzewidywalnych, tzn. czy mają naturę chaotyczną (rozumiem, że masz na myśli chaos deterministyczny), czy probabilistyczną. Charakter ŁĄCZNY procesów, które prowadzą do stwierdzenia wygranej szóstki w Lotto (a więc przede wszystkim: sposób konstrukcji maszyny losującej, sposób wybierania liczb przez miliony niepowiązanych ze sobą graczy itd.) raczej nie wskazuje na to, by można było to wszystko traktować jako układ chaotyczny...



W oryginalnym wątku ja NIE BADAŁEM LOSOWOŚCI LICZB. Badałem losowość rozkładu stwierdzonych SZÓSTEK, na co składa się:



1) wynik działania maszyny (być może nie spełniającej postulatu losowości)

2) wynik działania milionów osób, które wypełniły kupony



Stwierdzenie szóstki polega na zestawieniu jednego ORAZ drugiego. Zadam więc chyba oczywiste pytanie: czy wprowadzenie elementu losowego (za taki uznałbym proces wypełniania kuponów) do układu PONAD WSZELKĄ WĄTPLIWOŚĆ chaotycznego (niech będzie, że maszyna to układ chaotyczny) zmienia go w układ niedeterministyczny?



Gdyby ograniczyć się wyłącznie do losowania kulek, istotnie można by zadawać pytanie o to, czy trajektorie kulek są jakoś zdeterminowane, czy nie. Ale do czego taka odpowiedź by nas doprowadziła? Niezależnie przecież od tego, ta maszyna (szerzej: każda próba implementacji "losowania") to tylko lepsze lub gorsze przybliżenie procesu losowego (jednak w domyśle losowego, a nie chaotycznego). I o to, tzn. o EFEKT jej działania chodzi... tzn. o to, co "widzimy", bez względu na to, jak to powstaje...



Koncepcja chaosu jest ciekawa, ale warto "zejść na ziemię" i nie ignorować wiedzy a priori, którą dysponujemy zanim postawimy pytanie: chaos to, czy statystyka? Jeżeli znajdziesz przesłanki świadczące, że ciąg zdarzeń, które prowadzą do stwierdzenia wygranej 6/6 w Lotto (wypełnianie kuponów, losowanie kulek w studiu itd.) może być traktowane jako układ chaotyczny, będziesz mógł kwestionować stosowanie statystyki do opisu tego układu w warstwie fundamentalnej (wówczas nawet nie powinniśmy używać słowa "losowanie"). Co jeszcze nie będzie z automatu przekreślało słuszności wniosków uzyskanych w warstwie "wynikowej", tzn. obserwowanych wyników zachowania tego układu (szczególnie gdy rozmawiamy na poziomie niezbyt ściśle zdefiniowanych pojęć... wystarczy "losowość" zastąpić przez "nieprzewidywalność" i już możesz pogodzić podejście chaotyczne i probabilistyczne - w sensie wniosków, nie założeń i narzędzi)... No chyba że ten układ (w szczególności sposób generowania trajektorii kulek wraz z opisem warunków startowych, m.in.: sposób ułożenia kulek na dnie bębna po zwolnieniu blokady, pęd strumienia powietrza, ciśnienie w studio itp. itd.) precyzyjnie (matematycznie) mi opiszesz (a przecież nikt tego nigdy nie zrobi) - wtedy ostatnie stwierdzenie stanie się nieaktualne.



Póki jednak zostajemy na gruncie statystyki, odpowiem jeszcze na Twoje pytanie, które w zasadzie sprowadzi się do tego, czy z faktu, że 50x padły na przemian 0 i 1 wynika, że następną liczbą powinno być 0. Nie, nie wynika. I nadal nie będzie to przeczyło tezie o braku losowości, co test potwierdzi. Test robisz zawsze w danej chwili, dysponując "dowodami" czy "przesłankami" jakie akurat są dostępne (próbą). Na tym polegają testy istotności (jeśli masz dostęp do populacji, masz pełną wiedzę i żadne testowanie nie jest do niczego potrzebne). Jeżeli analizujesz zjawisko aktualnie trwające, jest chyba oczywiste, że wnioski mogą ulec zmianie wraz z napływem nowych informacji. Tylko historycy mogą dojść do jakichś wiążących konkluzji (a i oni nie zgadzają się między sobą, bo mają inne źródła niepewności dla swoich wniosków). W takiej sytuacji trzeba sobie postawić pytanie, czy zmieniły się istotnie parametry procesu, który dane wygenerował, czy też stosowane narzędzie było nieadekwatne do natury badanego zjawiska, której ocena musiała ulec weryfikacji. Czy badacz taki błąd może popełnić? Oczywiście, bo - jak napisałem - bazuje na tym, co jest mu dostępne. Przyszłości nie zna nikt. I wtedy mógłbyś, w szczególności, powiedzieć: poprzednie wnioski były błędne, bo używano niewłaściwego narzędzia. Ale nawet wtedy, czy zmieni się ich poprawność w stosunku do TAMTYCH, ograniczonych, danych? Niekoniecznie.



Całe wnioskowanie powinno opierać się na założeniu, że możemy się MYLIĆ. Ale to nie przekreśla zasadności podejmowania prób wyciągania jakichś wniosków. Na tym chyba polega nauka: nieustannym myleniu się i wyciąganiu z tego wniosków...
2015-10-24 (10:50)

status ralfek
Data rejestracji: 2009-07-08
Ilość postów: 3863

4876
wpis nr 939 003
[ CZCIONKA SPECJALNA ]

No tu się pojawia trudny charakter losowości, nikt do końca nie wiem czym jest, po prostu nie chcę żeby ktoś ferował wyroki o braku losowości, bo nieznajomość przyszłości nie pozwala nam stwierdzić jej braku..
| Dodaj wpis w tym temacie | Spis tematów | Wyniki lottoStrona: 1
Wyślij wiadomość do admina