Esercizi per il corso di Probabilità e Statistica
Table of Contents
Foglio 1: Statistica descrittiva
Esercizio 1
Per ognuna delle seguenti variabili si dica se si tratta di una variabile quantitativa (discreta o continua) o qualitativa (nominale o ordinale):
- l'età degli studenti in questo corso;
- i programmi preferiti dalle studentesse di questo corso;
- il numero degli studenti di questo corso che guardano la trasmissione "X Factor";
- le spese di trasporto sostenute dagli studenti di questo corso;
- il voto riportato all'esame di matematica;
- l'aver superato l'esame di matematica.
Risposte
- continua
- nominale
- discreta
- discreta
- discreta
Esercizio 2
Il docente di un corso universitario ha raccolto alcuni dati sugli studenti che hanno sostenuto il suo esame. La tabella riporta i dati relativi ai primi quattro studenti.
Voto | Anno di corso | Residenza | Diploma Sup. Frequentante |
---|---|---|---|
28 | I | Treviso | Liceo S |
21 | IV | Venezia | Ist. Tecnico N |
18 | I | Verona | Ist. Comm. S |
21 | II | Padova | Ist. Prof. S |
- Qual è l'unità statistica? Qual è la popolazione di riferimento?
- Quali caratteri (variabili) sono rilevati?
- Quali sono le modalità rilevate del Diploma Superiore?
- Quali sono le modalità rilevate del Voto e quali quelle possibili?
Risposte
- L'unità statistica è lo studente e la popolazione è l'insieme degli studenti che hanno superato l'esame.
- Sono rilevati il voto, l'anno di corso, la residenza e il diploma di scuola superiore
- Le modalità rilevate del diploma superiore sono: Liceo S, Ist. Tecnico N, Ist. Comm. S, Ist. Prof. S...
- Le modalità rilevate del voto sono ins, 18, 19, 20,... 30, 30L (non è specificato che l'esame sia superato)
Esercizio 3
In un gruppo di 20 persone sono state rilevate due variabili, il sesso e l'età
47 61 38 40 26 41 49 65 53 55 F M M M F M F F M F 30 23 34 33 40 21 65 32 47 50 M F M F M M M F F F
- Si costruisca la distribuzione per classi dell'età (utilizzando le classi 19-29, 30-44, 45-59, 60 e oltre) e si calcolino le frequenze assolute, relative, percentuali, le cumulate e le densità di frequenza. Si disegni un opportuno istogramma.
- Si rappresenti la funzione di ripartizione empirica e se ne calcoli il valore nel
punto 57. - Si disegni il diagramma a scatola con baffi, partendo dai dati originari.
- Si calcolino media, varianza, scarto quadratico medio, campo di variazione,
scarto interquantile e coefficiente di variazione. - Si chiamino yi i valori originari e zi quelli standardizzati: si trovino media e
varianza degli zi attraverso le corrispondenti quantità degli yi.
Risposte
-
freq. ass f. rel. % ass. cum rel. cum dens. 19-29 3 0,15 15 3 0,15 0,3 30-44 8 0,4 40 11 0,55 ˜0,57 45-59 6 0,3 30 17 0,85 ˜0,43 60+ 3 0,15 15 20 1 0,6 Grafico:
- Grafico della ripartizione empirica:
Ripartizione empirica = frequenza relativa di unità con valore ≤ x.
La ripartizione empirica di 57 è 0,85. - Grafico:
- Dati A = l'insieme dei valori; n = il numero di elementi in A; A(i) l'i-esimo elemento di A (i ∈ ℕ):
- media
Usando R, si ottiene che mean(A) = 42,5 - varianza
La media dei quadrati è 1973,2, il quadrato della media è 1806,25, quindi la varianza è 166,95 - scarto quadratico medio (radice della varianza): ˜12,92
- campo di variazione: la differenza tra il valore più alto (65) e il più basso (21): 65-21 = 44
- scarto interquantile: differenza tra il terzo e il primo quartile. [21 23 26 30 32] [33 34 38 40 40] [41 47 47 49 50] [53 55 61 65 65] 50-32 = 18
- coefficiente di variazione ⇒?
- media
Esercizio 4
L'assistenza tecnica di un rivenditore di computer ha registrato le richieste di intervento in un particolare giorno. Il risultato è stato:
H,H,M,S,H,M,M,S,H,S,S,M,H,M,M,S,M
dove H=problemi hardware, S=problemi software, M=guasto monitor.
- Calcolare la distribuzione delle frequenze assolute e relative; disegnare il diagramma a barre;
- calcolare un indice di posizione opportuno
Risposte
-
F. ass. F. rel H 5 ˜0,29 S 5 ˜0,29 M 7 ˜0,41 - L'indice di posizione opportuno è la moda, il cui valore è M (guasto al monitor)
Esercizio 5
Nella tabella sottostante sono riportati i consumi (in milioni di tonnellate) di risorse naturali impiegate nell'economia italiana nel quinquennio 2000-2004 e le importazioni delle medesime risorse nello stesso arco temporale.
2000 2001 2002 2003 2004 Fabbisogno 2.357 2.295 2.214 2.077 2.184 Importazioni 329.028 330.035 334.807 343.784 360.282
- Si rappresentino graficamente i dati;
- si calcolino la covarianza e il coefficiente di correlazione e si dia un'interpretazione dei risultati.
Esercizio 6
Il responsabile della sicurezza di una grossa azienda ha rilevato il numero di tentativi di intrusione bloccati ogni giorno durante i primi 14 giorni del mese:
56 47 49 37 38 60 50 43 43 59 50 56 54 58
Dopo aver cambiato le impostazioni del firewall, le intrusioni bloccate nei 20 giorni
successivi sono state
53 21 32 49 45 38 44 33 32 43 53 46 36 48 39 35 37 36 39 45
Al fine di valutare l'efficacia delle nuove impostazioni, si confrontino il numero di tentativi di intrusione bloccati prima e dopo il cambio, calcolando il summary dei dati, tracciando i boxplot appaiati e commentando i risultati ottenuti.
Esercizio 7
I dati seguenti rappresentano il numero di registrazioni di nuovi account in dieci giorni consecutivi ad un sito di vendite online:
43 37 50 51 58 105 52 45 45 10
- Calcolare media, mediana, quartili e deviazione standard.
- Trovare gli outlier (osservazioni anomale) usando la regola 1:5Xdistanza interquartile.
- Eliminare gli outlier trovati e calcolare nuovamente media, mediana, quartili e scarto quadratico medio.
- Trarre delle conclusioni sull'influenza degli outlier sugli indici calcolati.
Esercizio 8
Un provider vuole valutare il carico della sua rete e registra il numero di utenti (in migliaia di persone) connessi contemporaneamente in 50 luoghi:
17.2 22.1 18.5 17.2 18.6 14.8 21.7 15.8 16.3 22.8 24.1 13.3 16.2 17.5 19.0 23.9 14.8 22.2 21.7 20.7 13.5 15.8 13.1 16.1 21.9 23.9 19.3 12.0 19.9 19.4 15.4 16.7 19.5 16.2 16.9 17.1 20.2 13.4 19.8 17.7 19.7 18.7 17.6 15.9 15.2 17.1 15.0 18.8 21.6 11.9
- Calcolare la media campionaria, la varianza e lo scarto quadratico medio dei dati rilevati.
- Calcolare il summary e costruire il boxplot.
- Calcolare lo scarto interquantile. Sono presenti delgli outliers?
- Tracciare un istogramma e commentare la simmetria della distribuzione.