Il paradosso del giorno del compleanno ovvero la fallacia logica del Post hoc ergo propter hoc


gallosole

È il canto del gallo che fa sorgere il sole?

Entrate in una sala affollata. Che probabilità ci sono che due persone compiano gli anni lo stesso giorno? «Dipende dal numero di persone», direte voi. Avete perfettamente ragione. Allora vi domando: quante persone ci devono essere per avere almeno il 50% delle probabilità che due compiano gli anni lo stesso giorno?

D’impulso si è portati a pensare che ne servano moltissimi. In realtà il numero è incredibilmente basso: 23.

Con 35 persone le probabilità superano l’80%. Con 50 persone siamo addirittura al 97% e con 70 arriviamo al 99,9%. Com’è possibile?

È possibile perché l’intuito ci inganna…

Di primo acchito confrontiamo la data di nascita di una persona con tutte le altre e ci fermiamo lì. In realtà dovremmo pensare a tutte le possibili coppie distinte di persone che si possono formare in quel gruppo.

Il calcolo delle probabilità ci dice che il numero di coppie che si possono formare da un insieme di n persone si calcola con la seguente formula delle “combinazioni senza ripetizione di n elementi a gruppi di k”:

[1] c(n, k) = n! / ((nk)! × k!)

Non spaventatevi perché non c’è niente di complicato; n è il numero di elementi nel gruppo (nel nostro caso il numero di persone nella stanza), k è il numero di elementi nella combinazione (nel nostro caso k=2 visto che ci interessano le coppie) e il punto esclamativo dopo il numero indica l’operazione di fattoriale. Per chi non lo sapesse 5!=1×2×3×4×5, 8!=1×2×3×4×5×6×7×8, e così via.

Facciamo un esempio semplice con 7 persone: Anna, Barbara, Carla, Daniela, Elena, Franca, Grazia. Secondo la nostra formuletta le coppie possibili che si possono formare con 7 persone sono:

7! / ((7-2)! × 2!) =
7! / (5! × 2!) =
1×2×3×4×5×6×7 / (1×2×3×4×5 × 1×2)

Notiamo che 1×2×3×4×5 appare sia al numeratore che al denominatore per cui lo possiamo cancellare. Inoltre 2! vale sempre 2. Resta quindi:

6×7 / 2 = 21

Questo trucchetto è valido in generale e lo possiamo utilizzare per semplificare la nostra formula in questo modo:

[2] c(n, 2) = n × (n – 1) / 2

Vediamo se è vero che il risultato è 21. Elenco le possibili coppie usando solo le iniziali dei nomi per brevità:

AB, AC, AD, AE, AF, AG (6 coppie)
BC, BD, BE, BF, BG (5)
CD, CE, CF, CG (4)
DE, DF, DG (3)
EF, EG (2)
FG (1)

Le coppie possibili sono quindi 6+5+4+3+2+1 = 21, che è il valore che avevamo calcolato.

Quanti tintinnii di bicchieri dobbiamo sentire a una cena dove ci sono 8 persone per essere sicuri che tutti abbiano condiviso il nostro brindisi? c(8,2) = 8×7/2 = 28. Cin cin!

Diciamo che ci fidiamo della nostra formula semplificata [2] e proviamo ad applicarla al primo numero che abbiamo visto: 23 persone.

c(23, 2) = 23×22 / 2 = 253

Non è complicato, vero? Bene. 253 coppie sono tanta roba. Già ora, ad intuito, ci rendiamo conto che la probabilità di compleanni coincidenti non possono essere così basse. Cerchiamo però di calcolarle.

Partiamo da tre piccole premesse:

  1. in calcolo delle probabilità e statistica le probabilità non sono espresse in percentuale ma in valori da 0 (evento impossibile) a 1 (evento certo). Per passare alla percentuale basta moltiplicare per 100.
  2. La probabilità che lanciando un dado regolare a 6 facce esca un certo valore è intuitivamente di 1/6. I lanci di un dado sono eventi indipendenti. La probabilità che un evento si riproponga più volte è uguale al prodotto delle singole probabilità. Quindi la probabilità che in due lanci esca lo stesso valore è di (1/6)×(1/6) = (1/6)2. Per 3 lanci la probabilità è (1/6)3 e così via.
  3. A volte (come in questo caso), è più semplice stimare la probabilità che un evento non accada invece che quella che accada. Se la probabilità che un evento accada è p, allora la probabilità dell’evento contrario (la probabilità che l’evento non accada) è 1 – p.
Alice0

Un buon non-compleanno a te

Ora uniamo gli ingredienti.

Invece che calcolare la probabilità p che una coppia tra 23 condivida il compleanno è molto più semplice affrontare il problema opposto: che probabilità p’ c’è che nessuna delle 23 coppie compia gli anni lo stesso giorno? Oppure, per dirla come in Alice attraverso lo specchio, che probabilità ci sono che tutte le persone nella stanza festeggino il loro non-compleanno?

La probabilità che due persone compiano gli anni lo stesso giorno è di 1/365.

La probabilità che non lo facciano è di 364/365.

La probabilità che 253 possibili coppie non compiano gli anni lo stesso giorno è quindi:

p’ = (364/365)253

È un valore che possiamo calcolare con una calcolatrice scientifica (anche quella di Windows, in modalità scientifica). Risulta circa:

p’ = 0,4995.

Quindi, la probabilità che tra 23 persone ce ne siano due che compiano gli anni lo stesso giorno è (circa) di:

p = 1 – p’ = 1 – 0,4995 = 0,5005

che moltiplicato per 100 fa il nostro 50% (50,05 circa se vogliamo essere pignoli).

In generale, se abbiamo n persone, la probabilità che due compiano gli anni lo stesso giorno è:

p = 1 – (364/365) c(n, 2)

dove c(n, 2) è la nostra formuletta semplificata [2] che sappiamo ormai calcolare perfettamente. Ecco alcuni valori:

n c(n,2) p p = 1 – p %
20 190 0,59377 0,40623 40,6%
25 300 0,43909 0,56091 56,1%
30 435 0,30318 0,69682 69,7%
35 595 0,19546 0,80454 80,5%
40 780 0,11766 0,88234 88,2%
45 990 0,06614 0,93386 93,4%
50 1225 0,03471 0,96529 96,5%
55 1485 0,01701 0,98299 98,3%
60 1770 0,00778 0,99222 99,2%
65 2080 0,00332 0,99668 99,7%
70 2415 0,00133 0,99867 99,9%

«Bene, molto interessante,» mi direte (perché siete educati e benevoli), «ci hai dimostrato che non è così difficile che a una festa ci siano due persone che compiono gli anni nello stesso giorno… E allora?».

Il punto è che questo discorso non vale solo per i compleanni. Che probabilità ci sono che due eventi accadano nella stessa settimana? Che probabilità ci sono che l’autobus passi proprio mentre vi state fumando una sigaretta? Che probabilità ci sono che un certo problema si manifesti in un bambino nella prima settimana dopo la somministrazione di un vaccino?

Il calcolo è sicuramente più complesso (e io sicuramente non lo so fare) ma il principio è lo stesso. Le probabilità, forse, sono molto più alte di quanto potremmo aspettarci; e siccome spesso si applicano a ciascuno di noi, diventa veramente improbabile che certe coincidenze non capitino a qualcuno.

Una relazione temporale, anche se all’apparenza molto singolare, non ne implica necessariamente una causale. È la fallacia logica del “Post hoc ergo propter hoc”, una tra le più convincenti, insidiose ed abusate, spesso anche in buona fede.


Vedi anche:

Annunci

One Response to Il paradosso del giorno del compleanno ovvero la fallacia logica del Post hoc ergo propter hoc

  1. Burino Carnevale ha detto:

    la probabilità dei compleanni uguali è anche maggiore perché le nascite non sono distribuite lungo l’anno in modo uniforme.

    la fallacia post hoc ergo propter hoc è una fallacia argomentativa della logica informale, ma la scienza può e deve fare di meglio: se qualcosa alle volte succede dopo una circostanza non si può scartare che ci sia una correlazione invocando questa fallacia: è necessario fare verifiche, esami ecc. su un campione vasto

    anche se … mettici pure il fatto che quando si ha a che fare con eventi rari è difficile studiarne la correlazione con circostanze precedenti.

    ci possono essere fattori ignoti e concause, fattori che aumentano i rischi, …

    ci sono anche le fallacie statistiche e le statistiche usate per ingannare.

    Come quando ti dicono che di una malattia muiono ennemila persona nel mondo, dimenticandosi di dire come sono distribuiti geograficamente questi morti… e vogliono vendere la medicina a te che sei in quella parte di mondo dove i numeri sono ben diversi, non essendoci i fattori di rischio che ci sono altrove. Guarda un po’, si sono dimenticati di dirti una cosa irrilevante come il fatto che il rischio di morire per quella malattia è molto maggiore se sei denutrito, hai carenza di vitamine, se bevi acqua putrida…

    senza contare le predisposizioni genetiche, che non si possono scartare ma non fanno statistica forse tranne per quei casi per i quali crediamo di aver capito tutto della macchina umana perché sappiamo cosa fa un pezzettino minuscolo di adn.

    Mi piace

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: