Immagina di essere in un casinò con 100€ in tasca. Prendi parte ad un semplice gioco in cui ad ogni partita puoi vincere 1€ o perdere 1€. Decidi di smettere di giocare quando andrai in profitto di 5€. Tu vinci quando esce una carta di picche dal mazzo (52 carte da poker), il banco vince quando esce qualsiasi altra carta.
Sapresti calcolare la probabilità che tu finisca la partita perché hai guadagnato effettivamente 5€? Mentre quella di terminarla perché sei senza soldi? In quanto tempo mediamente si conclude una partita? Queste probabilità varierebbero di molto se tu fossi entrato nel casinò con 1000€?
Queste e molte altre domande sono caratteristiche di un particolare problema spesso definito significativamente come rovina del giocatore . Esso è un caso particolare di una classe di processi stocastici ben più ampia, è infatti una passeggiata aleatoria su un insieme degli stati finito, con barriere assorbenti. Comunque, non fissiamoci troppo su questi concetti per il momento, l’importante è che l’ambientazione ti sia chiara, in caso non lo fosse rileggiti il problema all’inizio prima di proseguire 😉
Formalizzazione matematica del problema
Fino a questo punto, il problema immagino ti sembri interessante ma difficile da “attaccare” (o almeno per me è stato così). Le carte in gioco sono effettivamente parecchie, quindi un po’ di formalizzazione matematica non può che aiutare 😉
Diciamo $a=100€$ il capitale iniziale da cui parti con le tue giocate, esso è meglio definibile come stato iniziale del processo stocastico di rovina del giocatore.
Definiamo quindi $b=5€$ il capitale del banco, così da far corrispondere la casistica in cui tu (giocatore) sbanchi a quella di rovina del banco.
Possiamo definire ora il nostro problema come una passeggiata aleatoria sull’insieme finito ${0,1,2,…,a+b}$ con ${0}$ e ${a+b}$ stati assorbenti.
Capisco che di queste ultime righe tu possa non aver chiare molte cose, vediamo quindi di introdurre un minimo di nozioni teoriche, così da poter proseguire agevolmente nella trattazione del problema 😉
Assumiamo di valutare l’evolversi del gioco in termini del numero di partite fatte (piuttosto che del tempo trascorso tra la prima giocata e l’ultima), risulterà in questo modo più gestibile e facile da descrivere la sua evoluzione.
Definiamo stato della processo la quantità di denaro che il giocatore possiede in un determinato istante. Nel nostro particolare processo, diciamo stato ogni numero naturale che sta tra lo 0 e $a+b$.
Due stati $s_1$, $s_2$ si dicono comunicanti se, tramite un certo numero di transizioni, è possibile passare dal primo, $s_1$ al secondo, $s_2$.
Diciamo invece due stati direttamente comunicanti se tale transizione può avvenire in un singolo step (quindi giocando una sola partita).
Vediamo di spiegare meglio questi due ultimi concetti concentrandoci sul nostro problema particolare 😉
Nel contesto della rovina del giocatore, ad ogni partita io posso semplicemente guadagnare 1€ o perderne uno. Quindi ogni stato, che non sia ${0}$ o ${a+b}$, comunica direttamente solo con il precedente ed il successivo.
Con chi comunicano invece queste due eccezioni? Beh, se valutiamo il problema realistico, risulta evidente che essi non comunichino con alcuno stato (né direttamente, né dopo un qualsiasi numero di iterazioni), infatti dopo che il giocatore raggiunge 0€ o $a+b€$, il gioco terminerà. Diremo tali stati assorbenti proprio per questa ragione.
Risulta altrettanto intuitivo dire che ogni stato, che non sia ${0}$ e ${a+b}$, comunica indirettamente con tutti gli altri stati ${0,…,a+b}$. Infatti qualsiasi sia il mio capitale attuale, potrei vincere o perdere abbastanza partite per arrivare ad avere un qualsiasi altro capitale, semplice no? 😉
Per concludere questa parte di terminologia, diciamo transitorio uno stato nel quale il processo torna un numero finito di volte, ossia si ha probabilità maggiore di 0 di non tornarvi in tempo finito. Diciamo ricorrente uno stato visitato infinite volte dal processo, ossia nel quale si ha la certezza di ritornavi in tempo finito dopo averlo abbandonato.
Nel nostro caso particolare, gli stati ${0}$ e ${a+b}$ essendo assorbenti, sono anche ricorrenti infatti ho la certezza di ritornarvi in tempo finito una volta raggiunti (banalmente non mi muovo più da quegli stati appena li raggiungo).
Intuitivamente, tutti gli altri stati sono transitori, infatti comunicano con degli stati (${0}$ e ${a+b}$) che non sono comunicanti con quello di partenza. Sono destinato a non tornare nello stato iniziale quindi con probabilità maggiore di 0.
Una volta formalizzato leggermente il problema, possiamo divertirci ad analizzarne meglio alcune domande, senza dover appesantire troppo il linguaggio utilizzato.
Con che probabilità concludo il gioco perché senza soldi?
Detto tutto ciò e affiancandolo alla più immediata comprensione della situazione concreta, è abbastanza chiaro che il gioco prima o poi finisca. Per dimostrare quanto appena detto servirebbe un po’ di teoria in più, ma ci facciamo bastare l’intuizione e la seguente idea:
Se il gioco potesse durare all’infinito, dovrei visitare almeno qualche stato infinite volte. Ma siccome tutti gli stati tranne 2 sono transitori, questi li visiterò solamente un numero finito di volte. Segue che starò “infinito tempo” in uno dei due stati ricorrenti ${0}$ o ${a+b}$. La partita quindi si concluderà certamente in tempo finito 😉
E’ quindi banale chiedersi la probabilità di concludere la partita, questa sarà unitaria. Non è però per niente banale chiedersi quale sia la probabilità di perdere tutti i soldi, o equivalentemente di essere assorbiti nello stato ${0}$.
Per calcolare tale probabilità di assorbimento, anche detta di rovina del giocatore, si possono impostare delle equazioni di ricorrenza da cui ricavare delle forme esplicite per le probabilità.
L’obiettivo dei seguenti conti, sintetizzati per necessità di chiarezza, è quello di arrivare a fornire una formula esplicita per valutare la probabilità di essere assorbiti nello stato ${0}$ partendo dallo stato ${S}$. O più semplicemente, la probabilità di perdere tutti i soldi partendo con $S€$.
Prima di passare alle equazioni, vediamo la notazione che useremo:
La probabilità di perdere tutti i soldi partendo da un capitale di $I€$ al tempo 0 è:
$ P(X_n=0 \mid X_{0}=I)=P_I$
Indichiamo inoltre con $ q = P(X_{n+1}=i-1 | X_{n} = i) $ la probabilità di perdere la partita (quindi 1€) e con $ p = P(X_{n+1}=i+1 | X_{n}=i)$ la probabilità di vincere la partita.
Se non fosse chiaro, preferisco specificare che con $ X_{n}=i $ indicheremo che dopo $n$ partite (o al tempo n se ti risulta più intuitivo), ho in tasca $i€$.
L’equazione di riferimento che svilupperemo per trovare la formula esplicita della probabilità di rovina del giocatore è la seguente:
$ P_{i} = qP_{i-1} + pP_{i+1}$ che, intuitivamente, dice che la probabilità di perdere il gioco è uguale alla probabilità di vincere una partita e poi essere assorbiti in 0 dal nuovo stato raggiunto, a cui sommiamo la probabilità di perdere una partita ed essere assorbiti in 0 da questo nuovo stato. Per comodità, d’ora in poi ci riferiremo questa equazione con il simbolo (#).
L’equazione (#), può essere scritta così per ogni stato diverso da ${0}$ e ${a+b}$, le quali hanno delle equazioni più semplici e particolari:
$P_{0}=1 $ dato che essendo già nello stato 0, ho la certezza di rimanervi, mentre $P_{a+b}=0 $ dato che la partita si conclude con la rovina del banco e non essendoci più nulla da vincere, il gioco si conclude e io non posso perdere arrivando nello stato ${0}$.
Per comodità, nei prossimi calcoli indicheremo con $m=a+b $.
Ora, l’idea per sviluppare questo sistema di equazioni di ricorrenza, è di porre in relazione uno stato con il precedente nel seguente modo:
Sappiamo che $p+q=1$ infatti ad ogni partita ho la certezza di vincere o di perdere, non può accadere altrimenti. Quindi posso manipolare (#) come segue:
$P_{i}=(p+q)P_{i} $ e raccogliendo opportunamente $q$ a sinistra dell’uguale e $p$ alla sua destra in (#) segue che \[q (P_i – P_{i-1}) = p (P_{i+1} – P_i) \].
Ora, sviluppando tale equazione per il primo stato si ricava che $q(P_{0}-P_{1}) = p(P_{1}-P_{2})$, ovvero che $P_{1}-P_{2} = q/p (P_{0}-P_{1}) $.
Iterando tale relazione, si vede che $P_{i}-P_{i+1} = (q/p)^{i}(P_{0}-P_{1}) $. Questa equazione la chiameremo (*).
Infine, si esegue una somma a destra e sinistra sugli $i\in{0,1,2,..,m-1}$ per ricavare \[P_{0}-P_{m} = \sum_0^{m-1} (q/p)^{i} (P_{0}-P_{1})\] e quindi \[P_0-P_{1} = \frac{1}{\sum_0^{m-1} (q/p)^{i}}.\]
Ecco che finalmente, sommando in (*) per $i\in {j,j+1,..,m-1}$ otteniamo la formula finale \[P_j = \sum_{i=j}^{m-1} (q/p)^i (P_0-P_1)=\frac{\sum_{i=j}^{m-1} (q/p)^i}{\sum_{i=0}^{m-1} (q/p)^i }.\]
Qual è la probabilità di sbancare?
Ora che abbiamo fatto il “lavoro sporco” per trovare quale sia la probabilità di terminare il gioco senza soldi, abbiamo anche la possibilità di valutare quale sia la probabilità di vincere tutti i soldi del banco! 😉
Notando infatti che il gioco termina certamente (cosa non scontata per tutti i giochi), sappiamo che le possibilità sono due, ovvero esso termina perchè sono senza soldi o perchè ho sbancato. Possiamo quindi ricavare la probabilità di sbancare come segue:
$1 = P($ finisco senza soldi $\cup$ sbanco$) = P($finisco senza soldi$) + P($sbanco$)$, questo perché i due eventi sono incompatibili, ovvero non esiste alcuna casistica in cui io sbanco e perdo contemporaneamente (eventi ad intersezione nulla).
Quindi detta $P(X_{n}=m | X_{0}=i) = Q_{i}$ la probabilità di sbancare partendo da $i€$, ho la validità della seguente relazione: $Q_{i} = 1 – P_{i} $ e ciò è vero per ogni stato $i$ 😉
Analisi di un caso particolare del problema
Finora abbiamo ottenuto molti risultati davvero interessanti, ma se magari non avevi mai visto nulla relativo a questa classe di problematiche di matematica applicata, potresti avere un po’ di confusione in testa. Vediamo quindi di fare qualche conto più pratico sul problema, ponendoci in un caso molto particolare 🙂
Supponiamo che il gioco a cui stiamo partecipando sia testa o croce e la moneta con cui stiamo giocando è equilibrata, ossia $ p=q=1/2 $.
Risulta quindi chiaro che si semplificherà il tutto, infatti $\frac{p}{q}=1 $ e quindi tutte le sommatorie che comparivano in precedenza non diventano che delle semplici somme algebriche tra due numeri.
Infatti \[\sum_0^{m-1} (q/p)^{i} = m,\] molto semplice, no?! 😉
Mentre se tronchiamo la somma e la facciamo da $j$ a $m-1$ otterremo che tale sommatoria è semplicemente $m-j$.
Stai iniziando ad intravedere dove voglio portarti?
Beh, è abbastanza chiaro, infatti la formula esplicita che abbiamo ricavato prima, e che poteva sembrarti di difficile lettura, diventa molto più concisa e ricca di significato:
$P_{i} = {(m-i)} / {m} $ è la probabilità di essere assorbiti nello 0, partendo dallo stato i, sapendo che ad ogni partita si perde/vince con la stessa probabilità.
Per quanto visto prima, la probabilità di sbancare è
$Q_{i} = 1 – P_{i} = \frac{i}{m} $. Quindi in questo modo stiamo praticamente dicendo che più sono vicino allo 0, più è alta la mia probabilità di perdere il gioco, mentre più sono vicino alla m, più è alta la mia probabilità di vincere. Per vicinanza intendiamo una vicinanza relativa, rispetto alla “lunghezza” totale della mia possibile passeggiata aleatoria 😉
Ecco quindi che abbiamo risposto parzialmente ad un’altra delle domande iniziali, se avessi un capitale iniziale più alto e il rapporto tra esso e il capitale totale è superiore, allora ho più probabilità di sbancare.
Conclusione
Direi che con ciò abbiamo sviscerato parecchi aspetti di questo problema, seppur ce ne siano ancora un’infinità che non abbiamo nemmeno toccato. Se ti interessa l’analisi di questa tipologia di problemi, faccelo sapere che qualcos’altro da condividere lo troviamo sicuramente 😉
Lascia un commento