Distribuzione ipergeometrica

Quando si usa

  • Conosciamo la composizione della popolazione
  • Si può dividere in due nettamente la popolazione
  • Non c'è reinserimento

Esempi

Un software consiste di 12 programmi, 5 dei quali necessitano di un upgrade. Se vengono scelti a caso 4 programmi per un test. Qual è la probabilità che almeno 2 di essi siano da aggiornare? Qual è il numero medio di programmi da aggiornare tra i 4 scelti?

Formula

  • X = Variabile aleatoria che conta il numero di successi
  • n = numero di estrazioni
  • N = numero di elementi
  • K = numero di elementi "successo" (successo significa che è vero per il criterio. Per es. se cerchiamo un bug in un programma, "successo" significa che è stato trovato)
  • X˜Ip(N, K, n) = distribuzione ipergeometrica (I) in N campioni di K successi per n estrazioni
  • k = ciascuno dei numeri compresi tra max{0, n-(N-K)} e min{n, K}.
    max{0, n-(N-K)} significa che se faccio più estrazioni di quanti siano i casi di non-successo, sono sicuro di estrarre almeno un successo (es. bianco = successo, rosso = insuccesso; ho un'urna con 4 bianche e 5 rosse, faccio 6 estrazioni)
  • min{n, K} il ragionamento è analogo
PX=k=(Kk)(N-Kn-k)(Nn)

Soluzione dell'esempio

  • N = 12 (il numero di programmi della popolazione)
  • n = 4 (il numero di estrazioni)
  • K = 5 (il numero di successi)
  • X ≥ 2 (almeno due casi di successo, richiede il maggiore/uguale)

P(X≥2) = P(X≤1) = 1 - (P(X=0) + P(X=1))

1-(50)(12-54-0)(124)-(51)(12-54-1)(124)=1-(74)(124)-5(73)(124)

Dal momento che un coefficiente binomiale si calcola così:

(mn)=m!n!m-n!

e che

(m0)=1

e che

(m1)=m

otteniamo che

  • (74)=35
  • (73)=35
  • (124)=495

Con qualche passaggio otteniamo:

1-35495-5*35495=1933