Πίνακες Συχνοτήτων

Μετά τη συλλογή των στατιστικών δεδομένων είναι αναγκαία η κατασκευή συνοπτικών πινάκων που περιέχουν όλες τις απαραίτητες πληροφορίες του δείγματος. Ας υποθέσουμε ότι εξετάζουμε ένα δείγμα μεγέθους \nu ως προς ένα χαρακτηριστικό που εκφράζεται από την τυχαία μεταβλητή X. Υποθέτουμε ότι οι διαφορετικές τιμές που πήρε η μεταβλητή είναι: x_{1},\, x_{2},\, ... ,\,x_{k}, προφανώς k\leqslant \nu. Γενικά, την τυχαία τιμή που παίρνει η μεταβλητή τη συμβολίζουμε με x_{i} όπου ο δείκτης i παίρνει τις τιμές i=1,\,2,...,k.

Άσκηση 1

Στο πλαίσιο μιας έρευνας ρωτήσαμε 20 μαθητές Γ’ Λυκείου πόσα αδέλφια έχουν. Οι απαντήσεις που πήραμε είναι:

    \begin{align*} 2, \:1, \:0, \:0, \:1, \:1, \:1, \:2, \:3, \:1, \:\\ 0, \:1, \:1, \:1, \:0, \:2, \:2, \:0, \:3, \:1. \: \end{align}

    1. Ποιος είναι ο πληθυσμός που μελετάμε;
    2. Ποιο είναι το μέγεθος \nu του δείγματος;
    3. Ποια είναι η τυχαία μεταβλητή X και τι είδους είναι;
    4. Ποιες είναι οι διαφορετικές τιμές που παίρνει η μεταβλητή και ποιο το πλήθος k των διαφορετικών τιμών;

Λύση

    1. Ο πληθυσμός που μελετάμε είναι οι μαθητές της Γ’ Λυκείου.
    2. Το μέγεθος του δείγματος είναι \nu = 20.
    3. Το χαρακτηριστικό ως προς το οποίο μελετάμε τον πληθυσμό είναι ο αριθμός των αδελφών άρα η μεταβλητή X παίρνει για κάθε άτομο του δείγματος τιμή ίση με τον αριθμό αδελφών του ατόμου, δηλαδή X=0,\,1,\,2,\,3,\,4,... Η μεταβλητή είναι ποσοτική και διακριτή.
    4. Οι διαφορετικές τιμές που παίρνει η μεταβλητή στο συγκεκριμένο δείγμα είναι x_{1}=0,\,x_{2}=1,\,x_{3}=2,\,x_{4}=3, άρα k=4.

-Τέλος Λύσης-

Στην τιμή x_{i} αντιστοιχίζεται η (απόλυτη) συχνότητα (frequency) \nu_{i}, δηλαδή ο φυσικός αριθμός που δείχνει πόσες φορές εμφανίζεται η τιμή x_{i} της εξεταζόμενης μεταβλητής X στο σύνολο των παρατηρήσεων. Είναι φανερό ότι το άθροισμα όλων των συχνοτήτων είναι ίσο με το μέγεθος \nu του δείγματος, δηλαδή:

(1)   \begin{align*} \nu_{1}+\nu_{2}+\cdots+\nu_{k}=\nu \end{align*}

Αν διαιρέσουμε τη συχνότητα \nu_{i} με το μέγεθος \nu του δείγματος, προκύπτει η σχετική συχνότητα (relative frequency) f_{i} της τιμής x_{i}, δηλαδή:

(2)   \begin{align*} f_{i}=\frac{\nu_{i}}{\nu},\:i=1,2,...,k \end{align*}

Θεώρημα

Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

    1. 0\leqslant f_{i}\leqslant 1 για i=1,2,...,k
    2. f_{1}+f_{2}+\cdots+f_{k}=1

Απόδειξη

1. Προφανώς για τη συχνότητα \nu_{i} ισχύει 0\leqslant \nu_{i}\leqslant \nu οπότε:

    \[ 0\leqslant \nu_{i}\leqslant \nu \Rightarrow \frac{0}{\nu} \leqslant \frac{\nu_{i}}{\nu} \leqslant \frac{\nu}{\nu} \Rightarrow 0\leqslant f_{i}\leqslant 1 \]

2.

    \[ f_{1}+f_{2}+\cdots+f_{k}=\frac{\nu_{1}}{\nu}+\frac{\nu_{2}}{\nu}+\cdots+\frac{\nu_{k}}{\nu}=\frac{\nu_{1}+\nu_{2}+\cdots+\nu_{k}}{\nu}=\frac{\nu}{\nu}=1 \]

Συνήθως, τις σχετικές συχνότητες f_{i} τις εκφράζουμε ως επί τοις εκατό ποσοστό και συμβολίζονται με f_{i}\%, δηλαδή f_{i}\%=100\cdot f_{i}.

Οι ποσότητες x_{i} , \nu_{i} , f_{i} για ένα δείγμα συγκεντρώνονται σε ένα συνοπτικό πίνακα, που ονομάζεται πίνακας κατανομής συχνοτήτων ή απλά πίνακας συχνοτήτων. Για μια μεταβλητή, το σύνολο των ζευγών \left ( x_{i},\nu_{i} \right ) λέμε ότι αποτελεί την κατανομή συχνοτήτων και το σύνολο των ζευγών \left ( x_{i},f_{i} \right ), ή των ζευγών \left ( x_{i}, f_{i} \%\right ), την κατανομή των σχετικών συχνοτήτων.

Παρακάτω παρουσιάζεται η γενική μορφή που έχει ο πίνακας συχνοτήτων. Ο αριθμός των γραμμών του πίνακα χωρίς την πρώτη γραμμή (τίτλοι στηλών) και την τελευταία γραμμή (σύνολα) ισούται με k.

Αύξων
Αριθμός
\color{white}i
Τυχαία
Μεταβλητή
\color{white}x_{i}
Συχνότητα
\color{white}\nu_{i}
Σχετική
Συχνότητα
\color{white}f_{i}
Επί τοις εκατό
Σχετική Συχνότητα
\color{white}f_{i}\%
1 x_{1} \nu_{1} f_{1} f_{1}\%
2 x_{2} \nu_{2} f_{2} f_{2}\%
\vdots \vdots \vdots \vdots \vdots
k x_{k} \nu_{k} f_{k} f_{k}\%
Σύνολο \nu 1 100

Η πρώτη στήλη (Αύξων Αριθμός) συνήθως παραλείπεται. Για κάθε στοιχείο του πίνακα ο δείκτης i αντιστοιχεί στη γραμμή του πίνακα στην οποία βρίσκεται το στοιχείο, έτσι για παράδειγμα το στοιχείο \nu_{3} αντιστοιχεί στη συχνότητα της 3ης γραμμής.

Άσκηση 2 

Για τα δεδομένα της άσκησης 1 να κατασκευαστεί ο πίνακας συχνοτήτων, σχετικών συχνοτήτων και επί τοις εκατό σχετικών συχνοτήτων.

Λύση

Στη άσκηση 1 είδαμε ότι οι τιμές που παίρνει η μεταβλητή X είναι x_{1}=0, x_{2}=1, x_{3}=2 και x_{4}=3. Οι αντίστοιχες συχνότητες είναι \nu_{1}=5, \nu_{2}=9, \nu_{3}=4 και \nu_{4}=2. Για τις σχετικές συχνότητες έχουμε:

    \begin{align*} f_{1}&=\frac{\nu_{1}}{\nu}=\frac{5}{20}=0.25\\ f_{2}&=\frac{\nu_{2}}{\nu}=\frac{9}{20}=0.45\\ f_{3}&=\frac{\nu_{3}}{\nu}=\frac{4}{20}=0.2\\ f_{4}&=\frac{\nu_{4}}{\nu}=\frac{2}{20}=0.1 \end{align}

Τυχαία
Μεταβλητή
\color{white}x_{i}
Συχνότητα
\color{white}\nu_{i}
Σχετική
Συχνότητα
\color{white}f_{i}
Επί τοις εκατό
Σχετική Συχνότητα
\color{white}f_{i}\%
0 5 0.25 25
1 9 0.45 45
2 4 0.2 20
3 2 0.1 10
Σύνολο 20 1 100

-Τέλος Λύσης-

Στην περίπτωση των ποσοτικών μεταβλητών εκτός από τις συχνότητες \nu_{i} και τις σχετικές συχνότητες f_{i} χρησιμοποιούνται και οι λεγόμενες αθροιστικές συχνότητες (cumulative frequencies) N_{i} και οι αθροιστικές σχετικές συχνότητες (cumulative relative frequencies) F_{i}, οι οποίες εκφράζουν το πλήθος και το ποσοστό αντίστοιχα των παρατηρήσεων που είναι μικρότερες ή ίσες της τιμής x_{i}. Επομένως, η αθροιστική συχνότητα N_{i} υπολογίζεται από τη σχέση:

    \[ N_{i}&=\nu_{1}+\nu_{2}+\cdots+\nu_{i} \]

και η αθροιστική σχετική συχνότητα F_{i} υπολογίζεται από τη σχέση:

    \[ F_{i}&=f_{1}+f_{2}+\cdots+f_{i} \]

Πιο αναλυτικά για τις σχετικές συχνότητες έχουμε:

    \begin{align*} N_{1}&=\nu_{1}\\ N_{2}&=\nu_{1}+\nu_{2}\\ N_{3}&=\nu_{1}+\nu_{2}+\nu_{3}\\ &\vdots \\ N_{k}&=\nu_{1}+\nu_{2}+\cdots+\nu_{k} \end{align}

και αντίστοιχα για τις σχετικές αθροιστικές συχνότητες έχουμε:

    \begin{align*} F_{1}&=f_{1}\\ F_{2}&=f_{1}+f_{2}\\ F_{3}&=f_{1}+f_{2}+f_{3}\\ &\vdots \\ F_{k}&=f_{1}+f_{2}+\cdots+f_{k} \end{align}

Παρατηρούμε ότι η τελευταία (k) αθροιστική συχνότητα ισούται με το μέγεθος του δείγματος:

    \[ N_{k}&=\nu_{1}+\nu_{2}+\cdots+\nu_{k}=\nu \]

και η τελευταία (k) αθροιστική σχετική συχνότητα ισούται με μονάδα:

    \[ F_{k}&=f_{1}+f_{2}+\cdots+f_{k}=1 \]

Επίσης είναι φανερό ότι ισχύουν οι σχέσεις:

    \begin{align*} \nu_{1}&=N_{1}\\ \nu_{2}&=N_{2}-N_{1}\\ \nu_{3}&=N_{3}-N_{2}\\ &\vdots \\ \nu_{k}&=N_{k}-N_{k-1}\\ \end{align}

και

    \begin{align*} f_{1}&=F_{1}\\ f_{2}&=F_{2}-F_{1}\\ f_{3}&=F_{3}-F_{2}\\ &\vdots \\ f_{k}&=F_{k}-F_{k-1}\\ \end{align}

Άσκηση 3

Στον πίνακα της άσκησης 2 να προστεθούν οι στήλες αθροιστικών συχνοτήτων, αθροιστικών σχετικών συχνοτήτων και επί τοις εκατό αθροιστικών σχετικών συχνοτήτων.

Λύση

Για τις αθροιστικές συχνότητες έχουμε:

    \begin{align*} N_{1}&=\nu_{1}=5\\ N_{2}&=\nu_{1}+\nu_{2}=5+9=14\\ N_{3}&=\nu_{1}+\nu_{2}+\nu_{3}=5+9+4=18\\ N_{4}&=\nu_{1}+\nu_{2}+\nu_{3}+\nu_{4}=5+9+4+2=20 \end{align}

Για τις αθροιστικές σχετικές συχνότητες έχουμε:

    \begin{align*} F_{1}&=f_{1}=0.25\\ F_{2}&=f_{1}+f_{2}=0.25+0.45=0.7\\ F_{3}&=f_{1}+f_{2}+f_{3}=0.25+0.45+0.2=0.9\\ F_{4}&=f_{1}+f_{2}+f_{3}+f_{4}=0.25+0.45+0.2+0.1=1 \end{align}

Τυχαία
Μεταβλητή
\color{white}x_{i}
Συχνότητα
\color{white}\nu_{i}
Σχετική
Συχνότητα
\color{white}f_{i}
Επί τοις εκατό
Σχετική
Συχνότητα
\color{white}f_{i}\%
Αθροιστική
Συχνότητα
\color{white}N_{i}
Αθροιστική
Σχετ. Συχνότητα
\color{white}F_{i}
Επί τοις εκατό
Αθροιστική Σχετ.
Συχνότητα
\color{white}F_{i}\%
0 5 0,25 25 5 0.25 25
1 9 0,45 45 14 0.7 70
2 4 0,2 20 18 0.9 90
3 2 0,1 10 20 1 100
Σύνολο 20 1 100

-Τέλος Λύσης-

Προσοχή

Ο τρόπος κατασκευής του πίνακα συχνοτήτων που περιγράφεται παραπάνω μπορεί να εφαρμοστεί μόνο για:

    1. ποιοτικές μεταβλητές (χωρίς τις στήλες των αθροιστικών συχνοτήτων)
    2. και ποσοτικές διακριτές μεταβλητές που λαμβάνουν λίγες διαφορετικές τιμές.

Στην περίπτωση που η ποσοτική μεταβλητή είναι συνεχής ή διακριτή που λαμβάνει πολλές διαφορετικές τιμές, τότε για την κατασκευή του πίνακα συχνοτήτων απαιτείται ομαδοποίηση παρατηρήσεων (εκτός ύλης για το σχ. έτος 2019-2020).


Προσπαθήστε μόνοι σας

Άσκηση 4

Να συμπληρωθεί ο πίνακας

Τυχαία
Μεταβλητή
\color{white}x_{i}
Συχνότητα
\color{white}\nu_{i}
Σχετική
Συχνότητα
\color{white}f_{i}
Επί τοις εκατό
Σχετική
Συχνότητα
\color{white}f_{i}\%
Αθροιστική
Συχνότητα
\color{white}N_{i}
Αθροιστική
Σχετ. Συχνότητα
\color{white}F_{i}
Επί τοις εκατό
Αθροιστική Σχετ.
Συχνότητα
\color{white}F_{i}\%
x_{1} 5
x_{2} 8
x_{3} 12
x_{4} 15
x_{5} 10
Σύνολο

Άσκηση 5

Να συμπληρωθεί ο πίνακας

Τυχαία
Μεταβλητή
\color{white}x_{i}
Συχνότητα
\color{white}\nu_{i}
Σχετική
Συχνότητα
\color{white}f_{i}
Επί τοις εκατό
Σχετική
Συχνότητα
\color{white}f_{i}\%
Αθροιστική
Συχνότητα
\color{white}N_{i}
Αθροιστική
Σχετ. Συχνότητα
\color{white}F_{i}
Επί τοις εκατό
Αθροιστική Σχετ.
Συχνότητα
\color{white}F_{i}\%
1 20
2 25
3 0.82
4 9
Σύνολο

Άσκηση 6

Να συμπληρωθεί ο πίνακας

Τυχαία
Μεταβλητή
\color{white}x_{i}
Συχνότητα
\color{white}\nu_{i}
Σχετική
Συχνότητα
\color{white}f_{i}
Επί τοις εκατό
Σχετική
Συχνότητα
\color{white}f_{i}\%
Αθροιστική
Συχνότητα
\color{white}N_{i}
Αθροιστική
Σχετ. Συχνότητα
\color{white}F_{i}
Επί τοις εκατό
Αθροιστική Σχετ.
Συχνότητα
\color{white}F_{i}\%
x_{1} \alpha
x_{2} \beta 20
x_{3} \gamma 33
x_{4} \beta 0.86
x_{5} \alpha
Σύνολο

Άσκηση 7

Στο πλαίσιο μίας έρευνας ρωτήθηκαν \nu άτομα πόσες ημέρες το μήνα πηγαίνουν σινεμά. Οι απαντήσεις που δόθηκαν ήταν από 0 έως 4 ημέρες. Ισχύουν:

    • 5 άτομα πηγαίνουν σινεμά 4 ημέρες το μήνα.
    • 85 άτομα πηγαίνουν σινεμά το πολύ 2 ημέρες το μήνα.
    • Τα άτομα που πηγαίνουν σινεμά 2 ημέρες το μήνα είναι διπλάσια από τα άτομα που δεν πηγαίνουν καθόλου σινεμά.
    • Το 45% πηγαίνει σινεμά τουλάχιστον 2 ημέρες το μήνα.
    • Το 15% δεν πηγαίνει σινεμά.

Να συμπληρωθεί ο πίνακας συχνοτήτων με στήλες: x_{i}, \nu_{i}, f_{i}, f_{i}\%, N_{i}, F_{i} και F_{i}\%.


Στείλε την προσπάθειά σου

    Ονοματεπώνυμο (απαιτείται)

    Email (απαιτείται)

    Τάξη (απαιτείται)

    Τμήμα (απαιτείται)

    Θέμα

    Μήνυμα

    Επιτρεπόμενοι τύποι αρχείων: zip 7z jpeg jpg png doc docx opt pdf ggp