\documentstyle[12pt,dutch,a4wide]{article}
%\title{}
%\author{}
%\date{\today}
%\maketitle
%\tableofcontents

\begin{document}
\subsubsection*{24-3-1993 en 29-3 Michiel}
In het kader van ons 'telepatie'-onderzoek vroeg ik mij af of ik
'random'-getallen kan produceren. Dit heb ik geprobeerd met het volgende
computerprogramma:

\input{testmeze}

Ik er heb er voor gekozen om het woord in te typen zodat ik niet zomaar
willekeurig wat toetsen in druk. Ik moet het woord bedenken om het dan in te
typen. Ook wordt naar elke invoer het scherm weer helemaal leeg zodat je zo min
mogelijk door eerdere invoeren wordt be\"invloed. Na dit heel vaak gedaan te
hebben meen ik het volgende bij mij te moeten waarnemen:
\begin{itemize}
 \item Ik deed het vrij vlug zodat het getal dat ervoor intypte nog niet
 vergeten was. Ik denk dus dat er veel zessen naar vijfen getypd zijn en zo.
 Wellicht breid ik het programma nog eens zo uit dat het dit soort dingen ook
 meet.
 \item Ik vrees zelfs dat ik steeds wel ongeveer weet wat ik lang niet gehad
 heb en dat ik dat dan maar weer eens typ.
 \item Het viel mij op dat tien eigenlijk best weinig is, steeds dacht ik
 bijmezelf als ik een getal typte dat ik dat vast wel erg vaak al had gedaan.
\end{itemize}
Ik heb 150 getallen ingetypt en de resultaten zijn als volgt:\\

\begin{tabular}[htb]{|l*{10}{|c}|}
\hline
gezegd cijfer & 0& 1& 2& 3& 4& 5& 6& 7& 8& 9\\
\hline
aantal keer   &13&10&17&18&15&10&17&15&18&17\\
\hline
\end{tabular}\\

De getallen zijn niet echt schokkend. Het extreemste is dat er 2 maal 10
bij zit. Om een uitspraak te doen of dit echt vreemd is zal ik proberen de kans
dat er 2 of meer 10 of lager bij zit.
de kans dat bijvoorbeeld de nul 10 maal voor komt is:
\begin{equation}
 P(\hbox{10 maal een nul})=\left( \begin{array}{c} 150 \\ 10 \end{array} \right)
 \left( \frac{1}{10} \right) ^{10} \left( \frac{9}{10} \right) ^{150-10}
 \label{precies}
\end{equation}
Logischer is wellicht om de kans dat nul 10 maal of minder voor komt te
beschouwen:
\begin{equation}
 P(\hbox{10 of minder maal een nul})=\sum_{n=0}^{10} \left( \begin{array}{c} 150 \\ n \end{array} \right)
 \left( \frac{1}{10} \right) ^{n} \left( \frac{9}{10} \right) ^{150-n}
 \label{minder}
\end{equation}
Deze kans kan men op zoeken in tabellen, uitrekenen met eem computer, met de
hand  of benaderen met de normale verdeling (en dan daarvan de waarden opzoeken
in een tabel). Ik kan het niet opzoeken in een tabel want een tabel met de
cumulatieve binomiale verdelingen tot N=150 heb ik niet. De elegantste
oplossing vind ik de laatste methode, benaderen met  de normale verdeling. Dit
heb ik geprobeerd maar ik weet niet zeker of ik het goed deed. Er komt dan
uit: 0,0869. Omdat ik mezelf dus niet vertrouw heb ik geprobeerd om het met
'derive' uit te rekenen. Ik kreeg dit shitprogramma echter in de gauwigheid
niet zo ver om dit ongelooflijk simpele sommetje eventjes uit te rekenen.
Daarom heb ik nog maar even een pascalprogramma geschreven (Dit druk ik hier
niet af omdat ik daar geen zin in heb, ik heb namelijk gebruik gemaakt van al
eerder door mijn geprogrammeerde units en ik heb weinig zin om te gaan kijken
wat wel en niet hier zou moeten komen te staan). Dit programma heb ik
getest door hem waarden uit te laten rekenen die nog wel in mijn
tabellenboekje (van wiskunde A overgehouden) staan. Dit deed hij feilloos en ik
heb dus een onpeilbaar vertrouwen in dit programma ( behalve dan als ik echt
grote getallen in voer, dan loopt zelf dit heel slim geprogrameerde programma
nog vast in 'floating point overflows' en dergelijke, wellicht is het nog
slimmer te programeren. De kunst is om de tussenantwoorden niet te groot te
laten worden, maar ik zal hier verder niet over uitwijden). De kans op 10 of
minder maal een nul blijkt dan te zijn: 0,1069. De kans op precies 10 blijkt:
0.0495 te zijn. Ik vind dit niet echt goed
kloppen met mijn benadering via de normale verdeling, maar ik weet niet hoe
nauwkeurig die is en in hoeverre ik dit juist heb gedaan. Deze kans is niet
klein genoeg om de hypothese dat ik afkeer voor de nul te verwerpen.
(de kans zou dan kleiner moeten zijn dan 0,05 (algemeen aanvaarde grens). Dit
is hypothese toetsing en leerde ik  ook ooit bij wiskunde A. In de hypothese
toetsing zegt men dat de kans dat men de $H_0$-hypothese verwerpt terwijl hij
toch waar is kleiner moet zijn dan een te kiezen onbetrouwbaarheidsdrempel
$\alpha$ welke meesta als 5\% (vind ik nog vrij groot) gekozen wordt. De $H_0$
hypothese is de hypothese waarin niets aan de hand is, hier dus dat ik geen
voorkeur heb )

Tenslotte is het nog zo dat de kans dat de nul 10 of minder keer voorkomt dus
ongeveer 0.1 is maar dat ik van te voren niet wist naar welk getal ik ging
kijken. Het is dus ook zo dat {\em elk} getal een kans van 0.1 heeft om 10 of
minder keren voor te komen. De verwachtingswaarde van het aantal getallen
waarbij dat gebeurt is dus 1. Het zijn er echter twee. De kans hierop is:
\begin{equation}
 P(\hbox{2 maal 10 of minder keer voorkomen})=\left( \begin{array}{c} 10 \\ 2 \end{array} \right)
 \left( \frac{1}{10} \right) ^{2} \left( \frac{9}{10} \right) ^{8}
\end{equation}
Welke gelijk is aan: 0,1937. Wat geen reden is om de hypothese dat ik
willekeurig wat zeg ($H_0$) te verwerpen. De kans op tweemaal precies 10 is na
een soortegelijke berekening: 0.0651 waarna men $H_0$ ook niet mag verwerpen.
(ik denk overigens dat het beter is om kleiner of gelijk aan 10 te beschouwen
omdat mijn $H_1$ hypothese is:'ik zeg minder vaak een nul dan wat anders' en
niet 'ik zeg in 10/150*100\%=7\% een nul' ($H_2$) wat dus statistisch een
waarschijnlijker geval is, omdat de kans dat het toeval is daarop kleiner is.
Deze %H_2$ hypothese slaat verder ook nergens op en had men ook nooit van te
voren kunnen verzinnen (als men dit wel gedaan had, had het niet veel gescheelt
of men had hem nog kunnen aanvaarden ook nog). Deze hypothese is namelijk net
zoiets als de hypothese $H_3$ welke zegt dat ik na 150 keer altijd alles heb
gezegd zoals boven in de tabel staat. Deze hypothese zou aanvaard worden want
de kans dat het toeval is dat ik net toevallig die specifieke verdeling zou
geven als $H_0$ waar is, is vast wel idioot klein.

Ook wil ik nog opmerken dat alles wat ik in dit idee zeg niet zeker allemaal
klopt en logisch is (het zegt waarschijnlijk meer over mijn inzicht in
statistiek en hypothese toetsing dan over mijn voorkeur voor bepaalde cijfers).
Wel is zeker dat er over de gedane meting nog veel meer statistisch te zeggen
is. Wellicht zou er ook naar de volgorde gekeken moeten worden want ik denk
bijvoorbeeld wel dat ik een aversie heb tegen twee de zelfde getallen achter
elkaar zeggen, of drie maal (dit is niet genoteerd dus niet meer te doen, de
meting zou opnieuw gedaan moeten worden, en het programma uitgebreid moeten
worden).


\end{document}