Οι στατιστικές είναι από καιρό αναπόσπαστο μέρος της ζωής. Ο κόσμος το αντιμετωπίζει παντού. Με βάση στατιστικές, εξάγονται συμπεράσματα σχετικά με το πού και ποιες ασθένειες είναι κοινές, τι είναι περισσότερο σε ζήτηση σε μια συγκεκριμένη περιοχή ή σε ένα συγκεκριμένο τμήμα του πληθυσμού. Ακόμη και η κατασκευή πολιτικών προγραμμάτων υποψηφίων κυβερνητικών φορέων βασίζεται σε στατιστικά στοιχεία. Χρησιμοποιούνται επίσης από τις αλυσίδες λιανικής κατά την αγορά αγαθών και οι κατασκευαστές καθοδηγούνται από αυτά τα δεδομένα στις προτάσεις τους.
Η στατιστική παίζει σημαντικό ρόλο στη ζωή της κοινωνίας και επηρεάζει κάθε μέλος της, ακόμη και σε μικρά πράγματα. Για παράδειγμα, εάν σύμφωνα με στατιστικά, οι περισσότεροι άνθρωποι προτιμούν τα σκούρα χρώματα σε ρούχα σε μια συγκεκριμένη πόλη ή περιοχή, τότε η εύρεση ενός λαμπερού κίτρινου αδιάβροχου με λουλουδάτο στάμπα στα τοπικά καταστήματα θα είναι εξαιρετικά δύσκολη. Τι ποσότητες όμωςαυτά τα δεδομένα αθροίζονται για να έχουν τέτοιο αντίκτυπο; Για παράδειγμα, τι είναι «στατιστικά σημαντικό»; Τι ακριβώς εννοείται με αυτόν τον ορισμό;
Τι είναι αυτό;
Η στατιστική ως επιστήμη αποτελείται από έναν συνδυασμό διαφορετικών ποσοτήτων και εννοιών. Ένα από αυτά είναι η έννοια της «στατιστικής σημασίας». Αυτό είναι το όνομα της τιμής των μεταβλητών, η πιθανότητα εμφάνισης άλλων δεικτών στους οποίους είναι αμελητέα.
Για παράδειγμα, 9 στους 10 ανθρώπους φορούν παπούτσια από καουτσούκ στα πόδια τους κατά τη διάρκεια μιας πρωινής βόλτας για μανιτάρια στο φθινοπωρινό δάσος μετά από μια βροχερή νύχτα. Η πιθανότητα κάποια στιγμή 8 από αυτούς να βάλουν μοκασίνια σε καμβά είναι αμελητέα. Έτσι, στο συγκεκριμένο παράδειγμα, ο αριθμός 9 είναι αυτό που ονομάζεται «στατιστική σημασία».
Συνεπώς, αν αναπτύξουμε περαιτέρω το δεδομένο πρακτικό παράδειγμα, τα καταστήματα υποδημάτων αγοράζουν μπότες από καουτσούκ μέχρι το τέλος της καλοκαιρινής περιόδου σε μεγαλύτερες ποσότητες από ό,τι άλλες εποχές του χρόνου. Έτσι, το μέγεθος της στατιστικής τιμής έχει αντίκτυπο στη συνηθισμένη ζωή.
Φυσικά, σε σύνθετους υπολογισμούς, ας πούμε, κατά την πρόβλεψη της εξάπλωσης των ιών, λαμβάνεται υπόψη ένας μεγάλος αριθμός μεταβλητών. Αλλά η ίδια η ουσία του προσδιορισμού ενός σημαντικού δείκτη στατιστικών δεδομένων είναι παρόμοια, ανεξάρτητα από την πολυπλοκότητα των υπολογισμών και τον αριθμό των μεταβλητών τιμών.
Πώς υπολογίζεται;
Χρησιμοποιείται κατά τον υπολογισμό της τιμής του δείκτη "στατιστικής σημασίας" της εξίσωσης. Δηλαδή, μπορεί να υποστηριχθεί ότι σε αυτή την περίπτωση όλα αποφασίζονται από τα μαθηματικά. Η απλούστερη επιλογή υπολογισμού είναι μια αλυσίδα μαθηματικών πράξεων, στην οποία εμπλέκονται οι ακόλουθες παράμετροι:
- δύο τύποι αποτελεσμάτων που προέκυψαν από έρευνες ή τη μελέτη αντικειμενικών δεδομένων, όπως το ποσό των αγορών, που συμβολίζεται με α και β;
- δείκτης μεγέθους δείγματος και για τις δύο ομάδες – n;
- τιμή του συνδυασμένου μεριδίου δείγματος - p;
- τυπικό σφάλμα - SE.
Το επόμενο βήμα είναι να προσδιοριστεί η συνολική βαθμολογία του τεστ - t, η τιμή του συγκρίνεται με τον αριθμό 1,96. 1,96 είναι η μέση τιμή, μεταφέροντας ένα εύρος 95%, σύμφωνα με τη συνάρτηση κατανομής t του Student.
Συχνά τίθεται το ερώτημα ποια είναι η διαφορά μεταξύ των τιμών του n και του p. Αυτή η απόχρωση είναι εύκολο να διευκρινιστεί με ένα παράδειγμα. Ας πούμε ότι υπολογίζεται η στατιστική σημασία της αφοσίωσης σε οποιοδήποτε προϊόν ή επωνυμία ανδρών και γυναικών.
Σε αυτήν την περίπτωση, τα γράμματα θα ακολουθούνται από τα ακόλουθα:
- n - αριθμός ερωτηθέντων;
- p - αριθμός ικανοποιημένων με το προϊόν.
Ο αριθμός των ερωτηθέντων γυναικών σε αυτήν την περίπτωση θα οριστεί ως n1. Κατά συνέπεια, άνδρες - n2. Η ίδια τιμή θα έχει τους αριθμούς "1" και "2" του συμβόλου p.
Η σύγκριση της βαθμολογίας του τεστ με τον μέσο όρο των υπολογιστικών φύλλων του μαθητή γίνεται αυτό που ονομάζεται "στατιστική σημασία".
Τι σημαίνει επαλήθευση;
Τα αποτελέσματα οποιουδήποτε μαθηματικού υπολογισμού μπορούν πάντα να ελεγχθούν, αυτό διδάσκεται σε παιδιά στο δημοτικό σχολείο. Είναι λογικό να υποθέσουμεότι εφόσον τα στατιστικά στοιχεία καθορίζονται χρησιμοποιώντας την αλυσίδα των υπολογισμών, τότε ελέγχονται.
Ωστόσο, ο έλεγχος για στατιστική σημασία δεν είναι μόνο μαθηματικά. Η στατιστική ασχολείται με μεγάλο αριθμό μεταβλητών και διάφορες πιθανότητες, οι οποίες δεν είναι πάντα επιδεκτικές υπολογισμού. Δηλαδή, αν επιστρέψουμε στο παράδειγμα των λαστιχένιων παπουτσιών στην αρχή του άρθρου, τότε η λογική κατασκευή των στατιστικών δεδομένων στα οποία θα βασίζονται οι αγοραστές αγαθών για καταστήματα μπορεί να διαταραχθεί από ξηρό και ζεστό καιρό, που δεν είναι τυπικός για το φθινόπωρο. Ως αποτέλεσμα αυτού του φαινομένου, ο αριθμός των ατόμων που αγοράζουν λαστιχένιες μπότες θα μειωθεί και τα καταστήματα θα υποστούν απώλειες. Φυσικά, ένας μαθηματικός τύπος δεν είναι σε θέση να προβλέψει μια καιρική ανωμαλία. Αυτή η στιγμή ονομάζεται «λάθος».
Αυτή είναι απλώς η πιθανότητα τέτοιων σφαλμάτων και λαμβάνει υπόψη τον έλεγχο του επιπέδου της υπολογισμένης σημασίας. Λαμβάνει υπόψη τόσο τους υπολογισμένους δείκτες όσο και τα αποδεκτά επίπεδα σημαντικότητας, καθώς και τις ποσότητες που ονομάζονται συμβατικά υποθέσεις.
Ποιο είναι το επίπεδο σημασίας;
Η έννοια του "επίπεδου" περιλαμβάνεται στα κύρια κριτήρια στατιστικής σημασίας. Χρησιμοποιείται σε εφαρμοσμένες και πρακτικές στατιστικές. Αυτό είναι ένα είδος τιμής που λαμβάνει υπόψη την πιθανότητα πιθανών αποκλίσεων ή σφαλμάτων.
Το επίπεδο βασίζεται στον εντοπισμό διαφορών σε έτοιμα δείγματα, σας επιτρέπει να καθορίσετε τη σημασία τους ή, αντίθετα, την τυχαιότητά τους. Αυτή η έννοια δεν έχει μόνο ψηφιακές έννοιες, αλλά και τις ιδιόμορφες ερμηνείες τους. Εξηγούνπώς πρέπει να κατανοήσετε την τιμή και το ίδιο το επίπεδο καθορίζεται συγκρίνοντας το αποτέλεσμα με τον μέσο δείκτη, αυτό αποκαλύπτει τον βαθμό αξιοπιστίας των διαφορών.
Έτσι, μπορούμε να φανταστούμε την έννοια του επιπέδου απλά - είναι ένας δείκτης ενός αποδεκτού, πιθανού σφάλματος ή σφάλματος στα συμπεράσματα που εξάγονται από τα ληφθέντα στατιστικά δεδομένα.
Ποια επίπεδα σημασίας χρησιμοποιούνται;
Η στατιστική σημασία των συντελεστών πιθανότητας σφάλματος στην πράξη βασίζεται σε τρία βασικά επίπεδα.
Το πρώτο επίπεδο είναι το όριο στο οποίο η τιμή είναι 5%. Δηλαδή, η πιθανότητα λάθους δεν υπερβαίνει το επίπεδο σημαντικότητας του 5%. Αυτό σημαίνει ότι η εμπιστοσύνη στο άψογο και το αλάθητο των συμπερασμάτων που προκύπτουν με βάση τα δεδομένα στατιστικής έρευνας είναι 95%.
Το δεύτερο επίπεδο είναι το όριο του 1%. Συνεπώς, αυτός ο αριθμός σημαίνει ότι μπορεί κανείς να καθοδηγηθεί από τα δεδομένα που λαμβάνονται κατά τους στατιστικούς υπολογισμούς με 99% εμπιστοσύνη.
Τρίτο επίπεδο - 0,1%. Με αυτήν την τιμή, η πιθανότητα ενός σφάλματος είναι ίση με ένα κλάσμα του ποσοστού, δηλαδή, τα σφάλματα πρακτικά εξαλείφονται.
Τι είναι μια υπόθεση στη στατιστική;
Τα σφάλματα ως έννοια χωρίζονται σε δύο τομείς, που αφορούν την αποδοχή ή την απόρριψη της μηδενικής υπόθεσης. Μια υπόθεση είναι μια έννοια πίσω από την οποία, σύμφωνα με τον ορισμό, κρύβεται ένα σύνολο αποτελεσμάτων έρευνας, άλλα δεδομένα ή δηλώσεις. Δηλαδή περιγραφή της κατανομής πιθανοτήτων για κάτι που σχετίζεται με το αντικείμενο της στατιστικής λογιστικής.
Υπάρχουν δύο υποθέσεις σε απλούς υπολογισμούς - μηδέν και εναλλακτική. Η διαφορά μεταξύ τους είναι ότι η μηδενική υπόθεση βασίζεται στην ιδέα ότι δεν υπάρχουν θεμελιώδεις διαφορές μεταξύ των δειγμάτων που εμπλέκονται στον προσδιορισμό της στατιστικής σημασίας και η εναλλακτική είναι εντελώς αντίθετη από αυτήν. Δηλαδή, η εναλλακτική υπόθεση βασίζεται στην παρουσία σημαντικής διαφοράς σε αυτά τα δείγματα.
Ποια είναι τα λάθη;
Τα σφάλματα ως έννοια στα στατιστικά στοιχεία είναι σε ευθεία αναλογία με την αποδοχή αυτής ή της άλλης υπόθεσης ως αληθινής. Μπορούν να χωριστούν σε δύο κατευθύνσεις ή τύπους:
- ο πρώτος τύπος οφείλεται στην αποδοχή της μηδενικής υπόθεσης, η οποία αποδείχθηκε λανθασμένη.
- δευτερόλεπτο - προκαλείται από την ακολουθία της εναλλακτικής.
Ο πρώτος τύπος σφάλματος ονομάζεται ψευδώς θετικός και είναι αρκετά κοινός σε όλους τους τομείς όπου χρησιμοποιούνται στατιστικά στοιχεία. Αντίστοιχα, το σφάλμα του δεύτερου τύπου ονομάζεται ψευδώς αρνητικό.
Γιατί χρειαζόμαστε παλινδρόμηση στα στατιστικά;
Η στατιστική σημασία της παλινδρόμησης είναι ότι με τη βοήθειά της είναι δυνατό να καθοριστεί πόσο το μοντέλο των διαφόρων εξαρτήσεων που υπολογίζεται με βάση τα δεδομένα αντιστοιχεί στην πραγματικότητα. σας επιτρέπει να προσδιορίσετε την επάρκεια ή την έλλειψη παραγόντων για τη λογιστική και τα συμπεράσματα.
Η τιμή παλινδρόμησης προσδιορίζεται συγκρίνοντας τα αποτελέσματα με τα δεδομένα που αναφέρονται στους πίνακες Fisher. Ή χρησιμοποιώντας ανάλυση διασποράς. Οι δείκτες παλινδρόμησης είναι σημαντικοί ότανσύνθετες στατιστικές μελέτες και υπολογισμοί που περιλαμβάνουν μεγάλο αριθμό μεταβλητών, τυχαία δεδομένα και πιθανές αλλαγές.