Κρίσιμες τιμές στατιστικών f. Συνάρτηση Fisher στο excel και παραδείγματα της δουλειάς της

Πρόγραμμα Kerish Doctor. 06.04.2019
Επισκόπηση προγράμματος Η έκδοση υπολογιστή του Microsoft Excel Viewer θα επιτρέψει...

Η συνάρτηση FISCHER επιστρέφει τον μετασχηματισμό Fisher των ορισμάτων σε X. Αυτός ο μετασχηματισμός παράγει μια συνάρτηση που έχει κανονική και όχι λοξή κατανομή. Η συνάρτηση FISCHER χρησιμοποιείται για τον έλεγχο της υπόθεσης χρησιμοποιώντας τον συντελεστή συσχέτισης.

Περιγραφή της συνάρτησης FISCHER στο Excel

Όταν εργάζεστε με αυτή τη συνάρτηση, πρέπει να ορίσετε την τιμή της μεταβλητής. Αξίζει αμέσως να σημειωθεί ότι υπάρχουν κάποιες καταστάσεις στις οποίες αυτή τη λειτουργίαδεν θα παράγει αποτελέσματα. Αυτό είναι δυνατό εάν η μεταβλητή:

  • δεν είναι αριθμός. Σε μια τέτοια περίπτωση, η συνάρτηση FISCHER θα επιστρέψει την τιμή σφάλματος #VALUE!;
  • έχει τιμή είτε μικρότερη από -1 είτε μεγαλύτερη από 1. Σε σε αυτή την περίπτωσηΗ συνάρτηση FISCHER θα επιστρέψει την τιμή σφάλματος #NUM!

Η εξίσωση που χρησιμοποιείται για να περιγράψει μαθηματικά τη συνάρτηση FISCHER είναι:

Z"=1/2*ln(1+x)/(1-x)

Ας δούμε τη χρήση αυτής της συνάρτησης χρησιμοποιώντας 3 συγκεκριμένα παραδείγματα.



Εκτίμηση της σχέσης μεταξύ κέρδους και κόστους χρησιμοποιώντας τη συνάρτηση FISHER

Παράδειγμα 1. Χρησιμοποιώντας δεδομένα για τη δραστηριότητα εμπορικών οργανισμών, απαιτείται να γίνει μια αξιολόγηση της σχέσης μεταξύ του κέρδους Y (εκατομμύρια ρούβλια) και του κόστους X (εκατομμύρια ρούβλια) που χρησιμοποιείται για την ανάπτυξη προϊόντων (που φαίνεται στον Πίνακα 1).

Πίνακας 1 – Αρχικά δεδομένα:

ΧΥ
1 210.000.000,00 RUR95.000.000,00 RUR
2 1.068.000.000,00 RUB76.000.000,00 RUR
3 1.005.000.000,00 RUB78.000.000,00 RUR
4 610.000.000,00 RUR89.000.000,00 RUR
5 768.000.000,00 RUR77.000.000,00 RUR
6 799.000.000,00 RUR85.000.000,00 RUR

Το σχέδιο για την επίλυση τέτοιων προβλημάτων έχει ως εξής:

  1. Υπολογίζεται ο συντελεστής γραμμικής συσχέτισης r xy.
  2. Η σημασία του συντελεστή γραμμικής συσχέτισης ελέγχεται με βάση το t-test Student. Σε αυτή την περίπτωση, υποβάλλεται μια υπόθεση και ελέγχεται ότι ο συντελεστής συσχέτισης είναι ίσος με μηδέν. Η στατιστική t χρησιμοποιείται για τον έλεγχο αυτής της υπόθεσης. Εάν επιβεβαιωθεί η υπόθεση, η στατιστική t έχει κατανομή Student. Εάν η υπολογισθείσα τιμή t p > t cr, τότε η υπόθεση απορρίπτεται, η οποία υποδηλώνει τη σημασία του συντελεστή γραμμικής συσχέτισης και επομένως τη στατιστική σημασία της σχέσης μεταξύ X και Y.
  3. Προσδιορίζεται μια εκτίμηση διαστήματος για έναν στατιστικά σημαντικό συντελεστή γραμμικής συσχέτισης.
  4. Μια εκτίμηση διαστήματος για τον συντελεστή γραμμικής συσχέτισης προσδιορίζεται με βάση αντίστροφος μετασχηματισμός zΨαράς;
  5. Υπολογίζεται το τυπικό σφάλμα του συντελεστή γραμμικής συσχέτισης.

Τα αποτελέσματα της επίλυσης αυτού του προβλήματος με τις συναρτήσεις που χρησιμοποιούνται σε πακέτο Excelφαίνονται στο σχήμα 1.


Εικόνα 1 – Παράδειγμα υπολογισμών.

Οχι.Όνομα δείκτηΤύπος υπολογισμού
1 Συντελεστής συσχέτισης=CORREL(B2:B7,C2:C7)
2 Υπολογισμένη τιμή t-test tp=ABS(C8)/SQRT(1-POWER(C8,2))*SQRT(6-2)
3 Τιμή πίνακα t-test trh=STUDISCOVER(0,05,4)
4 Πίνακας τιμής προτύπου κανονική κατανομή zy=NORMSIV((0,95+1)/2)
5 Τιμή μετασχηματισμού Fisher z=FISHER(C8)
6 Αριστερή εκτίμηση διαστήματος για z=C12-C11*ROOT(1/(6-3))
7 Δεξιά εκτίμηση διαστήματος για z=C12+C11*ROOT(1/(6-3))
8 Αριστερή εκτίμηση διαστήματος για rxy=FISHEROBR(C13)
9 Δεξιά εκτίμηση διαστήματος για rxy=FISHEROBR(C14)
10 Τυπική απόκλιση για το rxy=ROOT((1-C8^2)/4)

Έτσι, με πιθανότητα 0,95, ο συντελεστής γραμμικής συσχέτισης βρίσκεται στην περιοχή από (–0,386) έως (–0,990) με τυπικό σφάλμα 0,205.

Έλεγχος της στατιστικής σημασίας της παλινδρόμησης χρησιμοποιώντας τη συνάρτηση FASTER

Παράδειγμα 2. Έλεγχος στατιστικής σημασίαςεξισώσεις πολλαπλή παλινδρόμησηΧρησιμοποιώντας το τεστ F του Fisher, βγάλτε συμπεράσματα.

Για να ελέγξουμε τη σημασία της εξίσωσης στο σύνολό της, υποβάλαμε την υπόθεση H 0 σχετικά με τη στατιστική ασημαντότητα του συντελεστή προσδιορισμού και την αντίθετη υπόθεση H 1 σχετικά με τη στατιστική σημασία του συντελεστή προσδιορισμού:

H 1: R2 ≠ 0.

Ας ελέγξουμε τις υποθέσεις χρησιμοποιώντας το τεστ F του Fisher. Οι δείκτες φαίνονται στον Πίνακα 2.

Πίνακας 2 - Αρχικά δεδομένα

Για να το κάνουμε αυτό, χρησιμοποιούμε τη συνάρτηση στο Excel:

ΠΙΟ ΓΡΗΓΟΡΑ (α;p;n-p-1)

  • α είναι η πιθανότητα που σχετίζεται με μια δεδομένη κατανομή.
  • p και n είναι ο αριθμητής και ο παρονομαστής των βαθμών ελευθερίας, αντίστοιχα.

Γνωρίζοντας ότι α = 0,05, p = 2 και n = 53, λαμβάνουμε την ακόλουθη τιμή για το F crit (βλ. Εικόνα 2).


Εικόνα 2 – Παράδειγμα υπολογισμών.

Έτσι μπορούμε να πούμε ότι η F υπολογίστηκε > F κρίσιμη. Ως αποτέλεσμα, η υπόθεση Η 1 για τη στατιστική σημασία του συντελεστή προσδιορισμού γίνεται αποδεκτή.

Υπολογισμός της τιμής του δείκτη συσχέτισης στο Excel

Παράδειγμα 3. Χρήση δεδομένων από 23 επιχειρήσεις σχετικά με: X είναι η τιμή του προϊόντος Α, χιλιάδες ρούβλια. Το Y είναι το κέρδος μιας εμπορικής επιχείρησης, η εξάρτησή τους μελετάται. Βαθμός μοντέλο παλινδρόμησηςέδωσε το εξής: ∑(yi-yx) 2 = 50000; ∑(yi-yср) 2 = 130000. Ποιος δείκτης συσχέτισης μπορεί να προσδιοριστεί από αυτά τα δεδομένα; Υπολογίστε την τιμή του δείκτη συσχέτισης και, χρησιμοποιώντας το κριτήριο Fisher, βγάλτε ένα συμπέρασμα σχετικά με την ποιότητα του μοντέλου παλινδρόμησης.

Ας προσδιορίσουμε το F crit από την έκφραση:

Υπολογισμός F = R 2 /23*(1-R 2)

όπου R είναι ο συντελεστής προσδιορισμού ίσος με 0,67.

Έτσι, η υπολογιζόμενη τιμή F υπολογίστηκε = 46.

Για να προσδιορίσουμε το F crit χρησιμοποιούμε την κατανομή Fisher (βλ. Εικόνα 3).


Εικόνα 3 – Παράδειγμα υπολογισμών.

Έτσι, η προκύπτουσα εκτίμηση της εξίσωσης παλινδρόμησης είναι αξιόπιστη.

Επί σε αυτό το παράδειγμαΑς εξετάσουμε πώς αξιολογείται η αξιοπιστία της εξίσωσης παλινδρόμησης που προκύπτει. Το ίδιο τεστ χρησιμοποιείται για να ελεγχθεί η υπόθεση ότι οι συντελεστές παλινδρόμησης είναι ταυτόχρονα ίσοι με μηδέν, a=0, b=0. Με άλλα λόγια, η ουσία των υπολογισμών είναι να απαντηθεί το ερώτημα: μπορεί να χρησιμοποιηθεί για περαιτέρω ανάλυση και προβλέψεις;

Για να προσδιορίσετε εάν οι διακυμάνσεις σε δύο δείγματα είναι παρόμοιες ή διαφορετικές, χρησιμοποιήστε αυτό το t-test.


Έτσι, ο σκοπός της ανάλυσης είναι να αποκτήσει κάποια εκτίμηση, με τη βοήθεια της οποίας θα μπορούσε να δηλωθεί ότι σε ένα ορισμένο επίπεδο του α, η εξίσωση παλινδρόμησης που προκύπτει είναι στατιστικά αξιόπιστη. Για αυτό χρησιμοποιείται συντελεστής προσδιορισμού R2.
Ο έλεγχος της σημασίας ενός μοντέλου παλινδρόμησης πραγματοποιείται χρησιμοποιώντας τη δοκιμή F Fisher, η υπολογισμένη τιμή της οποίας βρίσκεται ως ο λόγος της διακύμανσης της αρχικής σειράς παρατηρήσεων του δείκτη που μελετάται και η αμερόληπτη εκτίμηση της διακύμανσης της υπολειπόμενης ακολουθίας για αυτό το μοντέλο.
Εάν η υπολογιζόμενη τιμή με k 1 =(m) και k 2 =(n-m-1) βαθμούς ελευθερίας είναι μεγαλύτερη από την πινακοποιημένη τιμή σε ένα δεδομένο επίπεδο σημασίας, τότε το μοντέλο θεωρείται σημαντικό.

όπου m είναι ο αριθμός των παραγόντων στο μοντέλο.
Εκτίμηση στατιστικής σημασίας ενός ζευγαριού γραμμική παλινδρόμησηεκτελείται σύμφωνα με τον ακόλουθο αλγόριθμο:
1. Προβάλλεται μηδενική υπόθεση ότι η εξίσωση στο σύνολό της είναι στατιστικά ασήμαντη: H 0: R 2 =0 στο επίπεδο σημαντικότητας α.
2. Στη συνέχεια, προσδιορίστε την πραγματική τιμή του κριτηρίου F:


όπου m=1 για παλινδρόμηση κατά ζεύγη.
3. Η τιμή του πίνακα προσδιορίζεται από τους πίνακες κατανομής Fisher για ένα δεδομένο επίπεδο σημασίας, λαμβάνοντας υπόψη ότι ο αριθμός των βαθμών ελευθερίας για συνολικό ποσότετράγωνα (μεγαλύτερη διασπορά) ισούται με 1 και ο αριθμός βαθμών ελευθερίας του υπολειπόμενου αθροίσματος τετραγώνων (μικρότερη διασπορά) στη γραμμική παλινδρόμηση είναι n-2 (ή μέσω της συνάρτησης Excel FDIST(πιθανότητα;1;n-2)) .
Ο πίνακας F είναι η μέγιστη δυνατή τιμή του κριτηρίου υπό την επίδραση τυχαίων παραγόντων σε δεδομένους βαθμούς ελευθερίας και επίπεδο σημαντικότητας α. Το επίπεδο σημαντικότητας α είναι η πιθανότητα απόρριψης της σωστής υπόθεσης, εφόσον είναι αληθής. Τυπικά το α θεωρείται 0,05 ή 0,01.
4. Εάν η πραγματική τιμή του F-test είναι μικρότερη από την τιμή του πίνακα, τότε λένε ότι δεν υπάρχει λόγος να απορριφθεί η μηδενική υπόθεση.
Διαφορετικά, η μηδενική υπόθεση απορρίπτεται και με πιθανότητα (1-α) γίνεται αποδεκτή η εναλλακτική υπόθεση για τη στατιστική σημασία της εξίσωσης στο σύνολό της.
Τιμή πίνακα του κριτηρίου με βαθμούς ελευθερίας k 1 =1 και k 2 =48, πίνακας F = 4

συμπεράσματα: Δεδομένου ότι ο πίνακας της πραγματικής τιμής F > F, ο συντελεστής προσδιορισμού είναι στατιστικά σημαντικός ( η εκτίμηση της εξίσωσης παλινδρόμησης που βρέθηκε είναι στατιστικά αξιόπιστη) .

Ανάλυση διακύμανσης

.

Δείκτες ποιότητας εξίσωσης παλινδρόμησης

Παράδειγμα. Με βάση συνολικά 25 εμπορικές επιχειρήσεις, μελετάται η σχέση μεταξύ των ακόλουθων χαρακτηριστικών: X - τιμή του προϊόντος Α, χιλιάδες ρούβλια. Y είναι το κέρδος μιας εμπορικής επιχείρησης, εκατομμύρια ρούβλια. Κατά την αξιολόγηση του μοντέλου παλινδρόμησης προέκυψαν τα ακόλουθα: ενδιάμεσα αποτελέσματα: ∑(y i -y x) 2 = 46000; ∑(y i -y μέσος όρος) 2 = 138000. Ποιος δείκτης συσχέτισης μπορεί να προσδιοριστεί από αυτά τα δεδομένα; Υπολογίστε την τιμή αυτού του δείκτη με βάση αυτό το αποτέλεσμα και χρησιμοποιώντας Τεστ F Fisherεξάγουν συμπεράσματα σχετικά με την ποιότητα του μοντέλου παλινδρόμησης.
Διάλυμα. Από αυτά τα δεδομένα μπορούμε να προσδιορίσουμε την εμπειρική αναλογία συσχέτισης: , όπου ∑(y μέσος -y x) 2 = ∑(y i -y μέσος όρος) 2 - ∑(y i -y x) 2 = 138000 - 46000 = 92.000.
η 2 = 92.000/138000 = 0,67, η = 0,816 (0,7< η < 0.9 - связь между X и Y высокая).

Τεστ F Fisher: n = 25, m = 1.
R 2 = 1 - 46000/138000 = 0,67, F = 0,67/(1-0,67)x(25 - 1 - 1) = 46. Πίνακας F (1; 23) = 4,27
Δεδομένου ότι η πραγματική τιμή F > Ftable, η ευρεθείσα εκτίμηση της εξίσωσης παλινδρόμησης είναι στατιστικά αξιόπιστη.

Ερώτηση: Ποια στατιστικά στοιχεία χρησιμοποιούνται για τον έλεγχο της σημασίας ενός μοντέλου παλινδρόμησης;
Απάντηση: Για τη σημασία ολόκληρου του μοντέλου στο σύνολό του, χρησιμοποιούνται στατιστικές F (δοκιμή Fisher).

Το ακριβές τεστ Fisher είναι ένα κριτήριο που χρησιμοποιείται για τη σύγκριση δύο σχετικών δεικτών που χαρακτηρίζουν τη συχνότητα ενός συγκεκριμένου χαρακτηριστικού που έχει δύο τιμές. Τα αρχικά δεδομένα για τον υπολογισμό της ακριβούς δοκιμής του Fisher συνήθως ομαδοποιούνται με τη μορφή πίνακα τεσσάρων πεδίων.

1. Ιστορικό ανάπτυξης του κριτηρίου

Το κριτήριο προτάθηκε για πρώτη φορά Ρόναλντ Φίσερστο βιβλίο του Design of Experiments. Αυτό συνέβη το 1935. Ο ίδιος ο Fischer ισχυρίστηκε ότι η Muriel Bristol τον ώθησε σε αυτή την ιδέα. Στις αρχές της δεκαετίας του 1920, ο Ronald, η Muriel και ο William Roach τοποθετήθηκαν στην Αγγλία σε έναν αγροτικό πειραματικό σταθμό. Η Muriel ισχυρίστηκε ότι μπορούσε να καθορίσει τη σειρά με την οποία χύνονταν το τσάι και το γάλα στο φλιτζάνι της. Τότε δεν κατέστη δυνατό να εξακριβωθεί η ορθότητα της δήλωσής της.

Αυτό οδήγησε στην ιδέα του Fisher για την «μηδενική υπόθεση». Ο στόχος δεν ήταν να αποδειχθεί ότι η Muriel μπορούσε να διακρίνει τη διαφορά μεταξύ διαφορετικών φλυτζανιών τσαγιού. Αποφασίστηκε να διαψευσθεί η υπόθεση ότι μια γυναίκα κάνει μια επιλογή τυχαία. Διαπιστώθηκε ότι η μηδενική υπόθεση δεν μπορούσε ούτε να αποδειχθεί ούτε να δικαιολογηθεί. Αλλά μπορεί να διαψευσθεί κατά τη διάρκεια πειραμάτων.

Ετοιμάστηκαν 8 φλιτζάνια. Τα πρώτα τέσσερα γεμίζονται πρώτα με γάλα, τα άλλα τέσσερα με τσάι. Τα κύπελλα ήταν ανακατεμένα. Ο Μπρίστολ προσφέρθηκε να δοκιμάσει το τσάι και να μοιράσει τα φλιτζάνια σύμφωνα με τη μέθοδο παρασκευής του τσαγιού. Το αποτέλεσμα θα έπρεπε να ήταν δύο ομάδες. Η ιστορία λέει ότι το πείραμα ήταν επιτυχημένο.

Χρησιμοποιώντας τη δοκιμή Fisher, η πιθανότητα ότι το Bristol ενεργεί διαισθητικά μειώθηκε στο 0,01428. Δηλαδή, ήταν δυνατό να αναγνωριστεί σωστά το κύπελλο σε μία περίπτωση από τις 70. Ωστόσο, δεν υπάρχει τρόπος να μηδενιστούν οι πιθανότητες που καθορίζει τυχαία η Μαντάμ. Ακόμα κι αν αυξήσεις τον αριθμό των φλιτζανιών.

Αυτή η ιστορία έδωσε ώθηση στην ανάπτυξη της «μηδενικής υπόθεσης». Ταυτόχρονα, προτάθηκε το ακριβές κριτήριο του Fisher, η ουσία του οποίου είναι να απαριθμήσει όλα τα πιθανούς συνδυασμούςεξαρτημένες και ανεξάρτητες μεταβλητές.

2. Σε τι χρησιμεύει το ακριβές τεστ Fisher;

Το ακριβές τεστ Fisher χρησιμοποιείται κυρίως για σύγκριση μικρά δείγματα. Υπάρχουν δύο καλοί λόγοι για αυτό. Πρώτον, ο υπολογισμός του κριτηρίου είναι αρκετά επαχθής και μπορεί να διαρκέσει πολύ ή να απαιτήσει ισχυρούς υπολογιστικούς πόρους. Δεύτερον, το κριτήριο είναι αρκετά ακριβές (κάτι που αντικατοπτρίζεται ακόμη και στο όνομά του), γεγονός που επιτρέπει τη χρήση του σε μελέτες με μικρό αριθμό παρατηρήσεων.

Ιδιαίτερη θέση δίνεται στο ακριβές τεστ του Fisher στην ιατρική. Αυτό σημαντική μέθοδοςεπεξεργασία ιατρικών δεδομένων, η οποία έχει βρει την εφαρμογή της σε πολλά επιστημονική έρευνα. Χάρη σε αυτό, είναι δυνατή η μελέτη της σχέσης μεταξύ ορισμένων παραγόντων και των αποτελεσμάτων, η σύγκριση της συχνότητας των παθολογικών καταστάσεων μεταξύ δύο ομάδων ατόμων κ.λπ.

3. Σε ποιες περιπτώσεις μπορεί να χρησιμοποιηθεί το ακριβές τεστ Fisher;

  1. Οι μεταβλητές που συγκρίνονται πρέπει να μετρώνται σε ονομαστική κλίμακακαι έχουν μόνο δύο έννοιες, Για παράδειγμα, αρτηριακή πίεσηφυσιολογική ή αυξημένη, έκβαση ευνοϊκή ή δυσμενής, μετεγχειρητικές επιπλοκές παρούσες ή όχι.
  2. Η ακριβής δοκιμή του Fisher προορίζεται για σύγκριση δύο ανεξάρτητες ομάδες, διαιρούμενο με βάση τον παράγοντα. Κατά συνέπεια, ο παράγοντας θα πρέπει επίσης να έχει μόνο δύο πιθανές τιμές.
  3. Το τεστ είναι κατάλληλο για σύγκριση πολύ μικρών δειγμάτων: Το ακριβές τεστ Fisher μπορεί να χρησιμοποιηθεί για την ανάλυση πινάκων τεσσάρων μερών στην περίπτωση τιμών του αναμενόμενου φαινομένου μικρότερες από 5, το οποίο αποτελεί περιορισμό για τη χρήση του Pearson chi-square. δοκιμή, ακόμη και λαμβάνοντας υπόψη τη διόρθωση του Yates.
  4. Η ακριβής δοκιμή του Fisher μπορεί να είναι μονόπλευρη και διπλή. Με μια μονόπλευρη επιλογή, είναι γνωστό ακριβώς πού θα αποκλίνει ένας από τους δείκτες. Για παράδειγμα, μια μελέτη συγκρίνει πόσοι ασθενείς ανάρρωσαν σε σύγκριση με μια ομάδα ελέγχου. Θεωρείται ότι η θεραπεία δεν μπορεί να επιδεινώσει την κατάσταση των ασθενών, αλλά μόνο είτε να τη θεραπεύσει είτε όχι.
    Μια δοκιμή δύο ουρών αξιολογεί τις διαφορές συχνότητας σε δύο κατευθύνσεις. Δηλαδή, αξιολογείται η πιθανότητα τόσο υψηλότερης όσο και χαμηλότερης συχνότητας του φαινομένου στην πειραματική ομάδα σε σύγκριση με την ομάδα ελέγχου.

Ένα ανάλογο του ακριβούς τεστ του Fisher είναι το τεστ chi-square του Pearson, ενώ το ακριβές τεστ του Fisher έχει περισσότερα υψηλή ισχύς, ειδικά κατά τη σύγκριση μικρών δειγμάτων, και ως εκ τούτου έχει ένα πλεονέκτημα σε αυτή την περίπτωση.

4. Πώς να υπολογίσετε το ακριβές τεστ του Fisher;

Ας υποθέσουμε ότι μελετάμε την εξάρτηση της συχνότητας γεννήσεων παιδιών με συγγενείς δυσπλασίες (CDD) από το κάπνισμα της μητέρας κατά τη διάρκεια της εγκυμοσύνης. Για αυτό, επιλέχθηκαν δύο ομάδες εγκύων γυναικών, εκ των οποίων η μία ήταν μια πειραματική ομάδα, αποτελούμενη από 80 γυναίκες που κάπνιζαν στο πρώτο τρίμηνο της εγκυμοσύνης και η δεύτερη ήταν μια ομάδα σύγκρισης, συμπεριλαμβανομένων 90 γυναικών που ακολουθούσαν έναν υγιεινό τρόπο ζωής κατά τη διάρκεια της εγκυμοσύνης. Ο αριθμός των περιπτώσεων εμβρυϊκής συγγενούς δυσπλασίας που προσδιορίστηκε με δεδομένα υπερήχων στην πειραματική ομάδα ήταν 10, στην ομάδα σύγκρισης - 2.

Πρώτα συνθέτουμε πίνακας έκτακτης ανάγκης τεσσάρων πεδίων:

Η ακριβής δοκιμή Fisher υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

όπου Ν - συνολικός αριθμόςμελέτησε σε δύο ομάδες. ! - παραγοντικό, που είναι το γινόμενο ενός αριθμού και μιας ακολουθίας αριθμών, καθένας από τους οποίους είναι μικρότερος από τον προηγούμενο κατά 1 (για παράδειγμα, 4! = 4 3 2 1)

Ως αποτέλεσμα των υπολογισμών, βρίσκουμε ότι P = 0,0137.

5. Πώς να ερμηνεύσετε την τιμή της ακριβούς δοκιμής του Fisher;

Το πλεονέκτημα της μεθόδου είναι ότι το κριτήριο που προκύπτει αντιστοιχεί στην ακριβή τιμή του επιπέδου σημαντικότητας σελ. Δηλαδή, η τιμή 0,0137 που λήφθηκε στο παράδειγμά μας είναι το επίπεδο σημαντικότητας των διαφορών μεταξύ των συγκριτικών ομάδων στη συχνότητα ανάπτυξης συγγενών δυσπλασιών του εμβρύου. Είναι απαραίτητο μόνο να συγκριθεί αυτός ο αριθμός με το κρίσιμο επίπεδο σημαντικότητας, που συνήθως λαμβάνεται στην ιατρική έρευνα ως 0,05.

  • Εάν η τιμή της ακριβούς δοκιμής του Fisher είναι μεγαλύτερη από την κρίσιμη τιμή, γίνεται αποδεκτή μηδενική υπόθεσηκαι συμπεραίνεται ότι δεν υπάρχουν στατιστικά σημαντικές διαφορές στην επίπτωση της έκβασης ανάλογα με την παρουσία του παράγοντα κινδύνου.
  • Εάν η τιμή της ακριβούς δοκιμής του Fisher είναι μικρότερη από την κρίσιμη, γίνεται αποδεκτή εναλλακτική υπόθεσηκαι συμπεραίνεται ότι υπάρχουν στατιστικά σημαντικές διαφορές στην επίπτωση της έκβασης ανάλογα με την έκθεση στον παράγοντα κινδύνου.

Στο παράδειγμά μας ο Π< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин στατιστικά σημαντικά υψηλότεροαπό τους μη καπνιστές.

1. Πίνακας τιμών F-test του Fisher για επίπεδο σημαντικότητας α = 0,05

1 2 3 4 5 6 8 12 24
1 161,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254,32
2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63
5 6,61 5,79 5,41 5, 19 5,05 4,95 4,82 4,68 4,53 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54
11 4,84 3,98 3,59 3,36 3, 20 2,95 2,79 2,61 2,40

Όταν m=1, επιλέξτε 1 στήλη.

k 2 =n-m=7-1=6 - δηλ. η 6η γραμμή - λήψη αξία πίνακαΨαράς

Πίνακας F =5,99, y μ.ο. = σύνολο: 7

Η επίδραση του x στο y είναι μέτρια και αρνητική

ŷ - τιμή μοντέλου.

F υπολ. = 28,648: 1 = 0,92
200,50: 5

A = 1/7 * 398,15 * 100% = 8,1%< 10% -

αποδεκτή τιμή


Το μοντέλο είναι αρκετά ακριβές.

F υπολ. = 1/0,92 = 1,6

F υπολ. = 1,6< F табл. = 5,99

Θα πρέπει να είναι F υπολογ. >Τραπέζι F

Παραβιάστηκε αυτό το μοντέλο, επομένως αυτή η εξίσωση δεν είναι στατιστικά σημαντική.

Εφόσον η υπολογιζόμενη τιμή είναι μικρότερη από την τιμή του πίνακα, το μοντέλο είναι ασήμαντο.

1 Σ (y - ŷ) *100%
Ν y

Σφάλμα προσέγγισης.

A= 1/7*0,563494* 100% = 8,04991% 8,0%

Θεωρούμε ότι το μοντέλο είναι ακριβές εάν το μέσο σφάλμα προσέγγισης είναι μικρότερο από 10%.

Αναγνώριση παραμετρικού ζεύγους μη γραμμική παλινδρόμηση

Μοντέλο y = a * x b - συνάρτηση ισχύος

Για να εφαρμοστεί ο γνωστός τύπος, είναι απαραίτητος ο λογάριθμος του μη γραμμικού μοντέλου.

log y = log a + b log x

Υ=Γ+β*Χ -γραμμικό μοντέλο.

C = 1,7605 - (- 0,298) * 1,7370 = 2,278

Επιστροφή στο αρχικό μοντέλο

Ŷ=10 s *x b =10 2,278 *x -0,298

Οχι. U Χ Υ Χ Υ*Χ U I (y-ŷ)/yI
1 68,80 45,10 1,8376 1,6542 3,039758 2,736378 60,9614643 0,113932
2 61, 20 59,00 1,7868 1,7709 3,164244 3,136087 56,2711901 0,080536
3 59,90 57, 20 1,7774 1,7574 3,123603 3,088455 56,7931534 0,051867
4 56,70 61,80 1,7536 1,7910 3,140698 3, 207681 55,4990353 0,021181
5 55,00 58,80 1,7404 1,7694 3,079464 3,130776 56,3281590 0,024148
6 54,30 47, 20 1,7348 1,6739 2,903882 2,801941 60,1402577 0,107555
7 49,30 55, 20 1,6928 1,7419 2,948688 3,034216 57,3987130 0,164274
Σύνολο 405, 20 384,30 12,3234 12,1587 21,40034 21,13553 403,391973 0,563493
Μέσος 57,88571 54,90 1,760486 1,736957 3,057191 3,019362 57,62742 0,080499

Μπαίνουμε στο EXCEL μέσω του προγράμματος «Έναρξη». Εισάγουμε τα δεδομένα στον πίνακα. Στα "Εργαλεία" - "Ανάλυση Δεδομένων" - "Παλινδρόμηση" - ΟΚ

Εάν το μενού "Εργαλεία" δεν έχει τη γραμμή "Ανάλυση δεδομένων", τότε πρέπει να εγκατασταθεί μέσω "Εργαλεία" - "Ρυθμίσεις" - "Πακέτο ανάλυσης δεδομένων"

Πρόβλεψη ζήτησης για εταιρικά προϊόντα. Χρήση σε ΣΚΠ Λειτουργίες Excel"Τάση"

Α είναι η ζήτηση για το προϊόν. Β - χρόνος, ημέρες


Οχι. ΕΝΑ
1 11 1
2 14 2
3 13 3
4 15 4
5 17 5
6 17,9
7 18,4 7

Βήμα 1. Προετοιμασία αρχικών δεδομένων

Βήμα 2. Επεκτείνετε τον άξονα χρόνου, ρυθμίστε τον στο 6,7 προς τα εμπρός. Έχουμε το δικαίωμα να προβλέψουμε το 1/3 των δεδομένων.

Βήμα 3. Επιλέξτε το εύρος A6: A7 για τη μελλοντική πρόβλεψη.

Βήμα 4. Εισαγωγή συνάρτησης

Εισαγάγετε διάγραμμα μη τυπικά ομαλά γραφήματα

εύρος y έτοιμο.


Εάν κάθε επόμενη τιμή του άξονα του χρόνου μας διαφέρει όχι κατά λίγα τοις εκατό, αλλά κατά πολλές φορές, τότε δεν πρέπει να χρησιμοποιήσετε τη συνάρτηση "Τάση", αλλά τη συνάρτηση "Ανάπτυξη".


Αναφορές

1. Eliseeva «Οικομετρία»

2. Eliseeva "Εργαστήριο για την οικονομετρία"

3. Carlsberg "Excel for Analysis Purposes"


Εφαρμογή


Πολλές εξισώσεις, και σε κάθε εξίσωση - αρκετές μεταβλητές. Το πρόβλημα της εκτίμησης των παραμέτρων ενός τέτοιου διακλαδισμένου μοντέλου επιλύεται χρησιμοποιώντας πολύπλοκες και φανταχτερές μεθόδους. Ωστόσο, όλοι έχουν το ίδιο θεωρητική βάση. Επομένως, για να έχουμε μια αρχική ιδέα για το περιεχόμενο των οικονομετρικών μεθόδων, θα περιοριστούμε στις ακόλουθες παραγράφους στο να εξετάσουμε την απλή γραμμική παλινδρόμηση. ...

Ότι η σύγκριση των κατατάξεων (1) και (2) που μόλις έγινε δεν πραγματοποιήθηκε αυστηρά. Είναι σαφές ότι στα οικονομετρικά εργαλεία ενός ειδικού που διεξάγει έρευνα εμπειρογνωμόνων πρέπει να υπάρχει ένας αλγόριθμος για τη συμφωνία των κατατάξεων που λαμβάνονται διάφορες μεθόδους. Μέθοδος για τη συμφωνία ομαδοποιημένων ταξινομήσεων Το πρόβλημα που εξετάζεται εδώ είναι η εξαγωγή μιας γενικής χαλαρής σειράς από ένα σύνολο...

Πραγματοποιείται αντικαθιστώντας στην εξίσωση παλινδρόμησης τις τιμές των ανεξάρτητων μεταβλητών που καθορίζουν τις συνθήκες για τις οποίες γίνεται η πρόβλεψη. 2.2 Μέθοδοι προγραμματισμού και πρόβλεψης των εσόδων του προϋπολογισμού των τοπικών κυβερνήσεων Οι μέθοδοι πρόβλεψης και σχεδιασμού εκφράζονται σε μεθόδους και τεχνικές για την ανάπτυξη εγγράφων και δεικτών προβλέψεων και σχεδιασμού σε σχέση με τους διάφορους τύπους τους...

ΣΥΜΠΕΡΑΣΜΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Στατιστικά στοιχεία εγγραφής

Πληθυντικός R 0,947541801
R-τετράγωνο 0,897835464
Κανονικοποιημένο R-τετράγωνο 0,829725774
Τυπικό σφάλμα 0,226013867
Παρατηρήσεις 6
Ανάλυση διακύμανσης

Σημασία ΣΤ

Οπισθοδρόμηση 2 1,346753196 0,673376598 13,18219855 0,032655042
Υπόλοιπο 3 0,153246804 0,051082268
Σύνολο 5 1,5

Πιθανότητα

Τυπικό σφάλμα

t-statistic

P-τιμή

Κάτω 95%

Κορυφαίο 95%

Κάτω 95%

Κορυφαίο 95%

Υ-τομή 4,736816539 0,651468195 7,27098664 0,005368842 2,66355399 6,810079088 2,66355399 6,810079088
Μεταβλητή X1 0,333424008 0,220082134 1,51499807 0,227014505 -0,366975566 1,033823582 -0,366975566

Επιστρέφει το αντίστροφο της κατανομής πιθανότητας F (δεξιά ουρά). Αν p = FRIST(x;...), τότε FRIST(p;...) = x.

Η κατανομή F μπορεί να χρησιμοποιηθεί σε μια δοκιμή F, η οποία συγκρίνει τον βαθμό διασποράς δύο συνόλων δεδομένων. Για παράδειγμα, μπορείτε να αναλύσετε την κατανομή εισοδήματος των Ηνωμένων Πολιτειών και του Καναδά για να προσδιορίσετε εάν οι δύο χώρες είναι παρόμοιες όσον αφορά την πυκνότητα εισοδήματος.

Σπουδαίος:Αυτή η δυνατότητα έχει αντικατασταθεί από μία ή περισσότερες νέες δυνατότητες που παρέχουν μεγαλύτερη ακρίβεια και έχουν ονόματα που αντικατοπτρίζουν καλύτερα τον σκοπό τους. Αν και αυτή η δυνατότητα εξακολουθεί να χρησιμοποιείται για την παροχή συμβατότητα προς τα πίσω, ενδέχεται να μην είναι διαθέσιμο στο μέλλον εκδόσεις Excel, γι' αυτό συνιστούμε να χρησιμοποιήσετε τις νέες δυνατότητες.

Για να μάθετε περισσότερα σχετικά με τις νέες λειτουργίες, ανατρέξτε στα άρθρα F.REV Function και F.REV.PH Function.

Σύνταξη

FRIST(πιθανότητα,βαθμοί_ελευθερίας1,βαθμοί_ελευθερίας2)

Τα ορίσματα για τη συνάρτηση FRIST περιγράφονται παρακάτω.

    Πιθανότητα- απαιτούμενο επιχείρημα. Πιθανότητα που σχετίζεται με τη αθροιστική κατανομή F.

    Βαθμοί_ελευθερίας1- απαιτούμενο επιχείρημα. Αριθμητής βαθμών ελευθερίας.

    Βαθμοί_ελευθερίας2- απαιτούμενο επιχείρημα. Παρονομαστής βαθμών ελευθερίας.

Σημειώσεις

    Εάν κάποιο από τα ορίσματα δεν είναι αριθμός, το FRATE επιστρέφει την τιμή σφάλματος #VALUE!

    Αν "πιθανότητα"< 0 или "вероятность" >1, η συνάρτηση FRIST επιστρέφει την τιμή σφάλματος #NUM!.

    Εάν η τιμή των βαθμών_ελευθερίας1 ή βαθμών_ελευθερίας2 δεν είναι ακέραιος, περικόπτεται.

    Αν "degrees_freedom1"< 1 или "степени_свободы1" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

    Αν "degrees_freedom2"< 1 или "степени_свободы2" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

Η συνάρτηση FDIST μπορεί να χρησιμοποιηθεί για τον προσδιορισμό των κρίσιμων τιμών της κατανομής F. Για παράδειγμα, τα αποτελέσματα ANOVA περιλαμβάνουν συνήθως δεδομένα για τη στατιστική F, την πιθανότητα F και κρίσιμη αξίαΚατανομή F με επίπεδο σημαντικότητας 0,05. Για να προσδιορίσετε την κρίσιμη τιμή του F, πρέπει να χρησιμοποιήσετε το επίπεδο σημαντικότητας ως όρισμα πιθανότητας της συνάρτησης FDIST.

Με καθορισμένη τιμήπιθανότητα, η συνάρτηση FDIST αναζητά μια τιμή x για την οποία FDIST(x, βαθμοί_ελευθερίας1, βαθμοί_ελευθερίας2) = πιθανότητα. Έτσι, η ακρίβεια της συνάρτησης FDIST εξαρτάται από την ακρίβεια της FDIST. Για αναζήτηση, η συνάρτηση FRIST χρησιμοποιεί τη μέθοδο επανάληψης. Εάν η αναζήτηση δεν τελειώσει μετά από 100 επαναλήψεις, επιστρέφεται η τιμή σφάλματος #N/A.

Παράδειγμα

Αντιγράψτε δείγματα δεδομένων από παρακάτω πίνακακαι επικολλήστε τα στο κελί A1 του νέου Φύλλο Excel. Για να εμφανίσετε τα αποτελέσματα των τύπων, επιλέξτε τους και πατήστε F2 και μετά πατήστε Enter. Εάν είναι απαραίτητο, αλλάξτε το πλάτος των στηλών για να δείτε όλα τα δεδομένα.



Συνιστούμε να διαβάσετε

Κορυφή