\documentstyle[12pt,dutch,a4wide]{article} %\title{} %\author{} %\date{\today} %\maketitle %\tableofcontents \begin{document} \subsubsection*{24-3-1993 en 29-3 Michiel} In het kader van ons 'telepatie'-onderzoek vroeg ik mij af of ik 'random'-getallen kan produceren. Dit heb ik geprobeerd met het volgende computerprogramma: \input{testmeze} Ik er heb er voor gekozen om het woord in te typen zodat ik niet zomaar willekeurig wat toetsen in druk. Ik moet het woord bedenken om het dan in te typen. Ook wordt naar elke invoer het scherm weer helemaal leeg zodat je zo min mogelijk door eerdere invoeren wordt be\"invloed. Na dit heel vaak gedaan te hebben meen ik het volgende bij mij te moeten waarnemen: \begin{itemize} \item Ik deed het vrij vlug zodat het getal dat ervoor intypte nog niet vergeten was. Ik denk dus dat er veel zessen naar vijfen getypd zijn en zo. Wellicht breid ik het programma nog eens zo uit dat het dit soort dingen ook meet. \item Ik vrees zelfs dat ik steeds wel ongeveer weet wat ik lang niet gehad heb en dat ik dat dan maar weer eens typ. \item Het viel mij op dat tien eigenlijk best weinig is, steeds dacht ik bijmezelf als ik een getal typte dat ik dat vast wel erg vaak al had gedaan. \end{itemize} Ik heb 150 getallen ingetypt en de resultaten zijn als volgt:\\ \begin{tabular}[htb]{|l*{10}{|c}|} \hline gezegd cijfer & 0& 1& 2& 3& 4& 5& 6& 7& 8& 9\\ \hline aantal keer &13&10&17&18&15&10&17&15&18&17\\ \hline \end{tabular}\\ De getallen zijn niet echt schokkend. Het extreemste is dat er 2 maal 10 bij zit. Om een uitspraak te doen of dit echt vreemd is zal ik proberen de kans dat er 2 of meer 10 of lager bij zit. de kans dat bijvoorbeeld de nul 10 maal voor komt is: \begin{equation} P(\hbox{10 maal een nul})=\left( \begin{array}{c} 150 \\ 10 \end{array} \right) \left( \frac{1}{10} \right) ^{10} \left( \frac{9}{10} \right) ^{150-10} \label{precies} \end{equation} Logischer is wellicht om de kans dat nul 10 maal of minder voor komt te beschouwen: \begin{equation} P(\hbox{10 of minder maal een nul})=\sum_{n=0}^{10} \left( \begin{array}{c} 150 \\ n \end{array} \right) \left( \frac{1}{10} \right) ^{n} \left( \frac{9}{10} \right) ^{150-n} \label{minder} \end{equation} Deze kans kan men op zoeken in tabellen, uitrekenen met eem computer, met de hand of benaderen met de normale verdeling (en dan daarvan de waarden opzoeken in een tabel). Ik kan het niet opzoeken in een tabel want een tabel met de cumulatieve binomiale verdelingen tot N=150 heb ik niet. De elegantste oplossing vind ik de laatste methode, benaderen met de normale verdeling. Dit heb ik geprobeerd maar ik weet niet zeker of ik het goed deed. Er komt dan uit: 0,0869. Omdat ik mezelf dus niet vertrouw heb ik geprobeerd om het met 'derive' uit te rekenen. Ik kreeg dit shitprogramma echter in de gauwigheid niet zo ver om dit ongelooflijk simpele sommetje eventjes uit te rekenen. Daarom heb ik nog maar even een pascalprogramma geschreven (Dit druk ik hier niet af omdat ik daar geen zin in heb, ik heb namelijk gebruik gemaakt van al eerder door mijn geprogrammeerde units en ik heb weinig zin om te gaan kijken wat wel en niet hier zou moeten komen te staan). Dit programma heb ik getest door hem waarden uit te laten rekenen die nog wel in mijn tabellenboekje (van wiskunde A overgehouden) staan. Dit deed hij feilloos en ik heb dus een onpeilbaar vertrouwen in dit programma ( behalve dan als ik echt grote getallen in voer, dan loopt zelf dit heel slim geprogrameerde programma nog vast in 'floating point overflows' en dergelijke, wellicht is het nog slimmer te programeren. De kunst is om de tussenantwoorden niet te groot te laten worden, maar ik zal hier verder niet over uitwijden). De kans op 10 of minder maal een nul blijkt dan te zijn: 0,1069. De kans op precies 10 blijkt: 0.0495 te zijn. Ik vind dit niet echt goed kloppen met mijn benadering via de normale verdeling, maar ik weet niet hoe nauwkeurig die is en in hoeverre ik dit juist heb gedaan. Deze kans is niet klein genoeg om de hypothese dat ik afkeer voor de nul te verwerpen. (de kans zou dan kleiner moeten zijn dan 0,05 (algemeen aanvaarde grens). Dit is hypothese toetsing en leerde ik ook ooit bij wiskunde A. In de hypothese toetsing zegt men dat de kans dat men de $H_0$-hypothese verwerpt terwijl hij toch waar is kleiner moet zijn dan een te kiezen onbetrouwbaarheidsdrempel $\alpha$ welke meesta als 5\% (vind ik nog vrij groot) gekozen wordt. De $H_0$ hypothese is de hypothese waarin niets aan de hand is, hier dus dat ik geen voorkeur heb ) Tenslotte is het nog zo dat de kans dat de nul 10 of minder keer voorkomt dus ongeveer 0.1 is maar dat ik van te voren niet wist naar welk getal ik ging kijken. Het is dus ook zo dat {\em elk} getal een kans van 0.1 heeft om 10 of minder keren voor te komen. De verwachtingswaarde van het aantal getallen waarbij dat gebeurt is dus 1. Het zijn er echter twee. De kans hierop is: \begin{equation} P(\hbox{2 maal 10 of minder keer voorkomen})=\left( \begin{array}{c} 10 \\ 2 \end{array} \right) \left( \frac{1}{10} \right) ^{2} \left( \frac{9}{10} \right) ^{8} \end{equation} Welke gelijk is aan: 0,1937. Wat geen reden is om de hypothese dat ik willekeurig wat zeg ($H_0$) te verwerpen. De kans op tweemaal precies 10 is na een soortegelijke berekening: 0.0651 waarna men $H_0$ ook niet mag verwerpen. (ik denk overigens dat het beter is om kleiner of gelijk aan 10 te beschouwen omdat mijn $H_1$ hypothese is:'ik zeg minder vaak een nul dan wat anders' en niet 'ik zeg in 10/150*100\%=7\% een nul' ($H_2$) wat dus statistisch een waarschijnlijker geval is, omdat de kans dat het toeval is daarop kleiner is. Deze %H_2$ hypothese slaat verder ook nergens op en had men ook nooit van te voren kunnen verzinnen (als men dit wel gedaan had, had het niet veel gescheelt of men had hem nog kunnen aanvaarden ook nog). Deze hypothese is namelijk net zoiets als de hypothese $H_3$ welke zegt dat ik na 150 keer altijd alles heb gezegd zoals boven in de tabel staat. Deze hypothese zou aanvaard worden want de kans dat het toeval is dat ik net toevallig die specifieke verdeling zou geven als $H_0$ waar is, is vast wel idioot klein. Ook wil ik nog opmerken dat alles wat ik in dit idee zeg niet zeker allemaal klopt en logisch is (het zegt waarschijnlijk meer over mijn inzicht in statistiek en hypothese toetsing dan over mijn voorkeur voor bepaalde cijfers). Wel is zeker dat er over de gedane meting nog veel meer statistisch te zeggen is. Wellicht zou er ook naar de volgorde gekeken moeten worden want ik denk bijvoorbeeld wel dat ik een aversie heb tegen twee de zelfde getallen achter elkaar zeggen, of drie maal (dit is niet genoteerd dus niet meer te doen, de meting zou opnieuw gedaan moeten worden, en het programma uitgebreid moeten worden). \end{document}