שלטון Sturges הסבר, יישומים ודוגמאות



ה חוק סטורז ' הוא קריטריון המשמש לקביעת מספר הכיתות או המרווחים הנחוצים כדי לייצג בצורה גרפית קבוצה של נתונים סטטיסטיים. חוק זה הוכרז בשנת 1926 על ידי המתמטיקאי הגרמני הרברט סטורג '.

Sturges הציע שיטה פשוטה, המבוססת על מספר דגימות x המאפשרים למצוא את מספר הכיתות ואת משרעת טווח שלהם. הכלל Sturges נמצא בשימוש נרחב במיוחד בתחום הסטטיסטיקה, במיוחד כדי לבנות היסטוגרמות תדר.

אינדקס

  • 1 הסבר
  • 2 יישומים
  • 3 דוגמה
  • 4 הפניות

הסבר

הכלל Sturges הוא שיטה אמפירית בשימוש נרחב בסטטיסטיקה תיאורית כדי לקבוע את מספר הכיתות כי חייב להתקיים היסטוגרמה תדר, על מנת לסווג קבוצה של נתונים המייצגים מדגם או האוכלוסייה.

בעיקרון, כלל זה קובע את רוחב של מכולות גרפיות, היסטוגרמות תדר.

כדי לקבוע את שלטונו ראה הרברט סטורג'ס דיאגרמת תדר אידיאלית, המורכבת ממרווחי K, כאשר המרווח ith מכיל מספר מסוים של דגימות (i = 0, ... k - 1), המיוצגות על ידי:

מספר זה של דגימות ניתן על ידי מספר דרכים שבהן תת קבוצה של קבוצה ניתן לחלץ; כלומר, לפי המקדם הבינומי, המבטא כדלקמן:

כדי לפשט את הביטוי, הוא יישם את המאפיינים של הלוגריתמים בשני חלקי המשוואה:

לפיכך קבע סטורג 'כי המספר האופטימלי של המרווחים k ניתן על ידי הביטוי:

זה יכול גם לבוא לידי ביטוי:

בביטוי זה:

- k הוא מספר הכיתות.

- N הוא מספר התצפיות הכולל של המדגם.

- יומן הוא הלוגריתם המשותף של בסיס 10.

לדוגמה, כדי ליצור היסטוגרמה תדר המבטאת מדגם אקראי של גובה 142 ילדים, מספר המרווחים או השיעורים שיש לחלוקה יהיה:

k = 1 + 3,322 * יומן10 (N)

k = 1 + 3,322* יומן (142)

k = 1 + 3,322* 2,1523

k = 8.14 כ 850

לפיכך, ההפצה תהיה 8 intervals.

מספר המרווחים צריך תמיד להיות מיוצג על ידי מספרים שלמים. במקרים בהם הערך הוא עשרוני, יש לבצע קירוב למספר השלמות הקרוב ביותר.

יישומים

הכלל של Sturges מוחל בעיקר בסטטיסטיקה, שכן הוא מאפשר לבצע הפצה של תדרים באמצעות חישוב מספר של כיתות (k), כמו גם את אורך של כל אלה, המכונה גם משרעת.

משרעת הוא ההבדל בין הגבול העליון והתחתון של הכיתה, מחולק במספר הכיתות, והוא בא לידי ביטוי:

ישנם כללים אמפיריים רבים המאפשרים התפלגות תדר להיעשות. עם זאת, הכלל Sturges נפוץ כי זה בקירוב את מספר הכיתות, אשר בדרך כלל נע בין 5 ל 15.

בדרך זו, לשקול ערך המייצג כראוי המדגם או האוכלוסייה; כלומר, הקירוב אינו מייצג קבוצות קיצוניות, והוא אינו פועל עם מספר מופרז של שיעורים שאינם מאפשרים סיכום של המדגם.

דוגמה

יש צורך לבצע היסטוגרמה תדר על פי הנתונים הנתונים, המקביל לגילאים המתקבלים בסקר של גברים שעושים תרגילים בחדר כושר מקומי.

כדי לקבוע את מרווחי אתה חייב לדעת מה הוא גודל המדגם או מספר תצפיות; במקרה זה, יש לך 30.

לאחר מכן, חוק סטורג 'חל:

k = 1 + 3,322 * יומן10 (N)

k = 1 + 3,322* יומן (30)

k = 1 + 3,322* 1,4771

k = 5.90 ≈ 6 אינטרווליים.

מתוך מספר המרווחים, משרעת כי יהיו אלה ניתן לחשב; כלומר, רוחב כל סרגל המיוצג בהיסטוגרמה תדר:

הגבול התחתון נחשב הערך הנמוך ביותר של הנתונים, ואת הגבול העליון הוא הערך הגבוה ביותר. ההפרש בין הגבול העליון והתחתון נקרא טווח או נתיב המשתנה (R).

מן השולחן יש לנו כי הגבול העליון הוא 46 ואת הגבול התחתון 13; כך, המשרעת של כל מחלקה תהיה:

המרווחים יהיו מורכבים מהגבול העליון והתחתון. כדי לקבוע את המרווחים הללו, התחל לספור מהגבול התחתון, והוסיף לו את המשרעת שנקבעה על ידי הכלל (6), כדלקמן:

אז תדירות מוחלטת מחושב כדי לקבוע את מספר הגברים המתאימים כל מרווח; במקרה זה הוא:

- מרווח 1: 13 - 18 = 9

- מרווח 2: 19 - 24 = 9

- מרווח 3: 25 - 30 = 5

- מרווח 4: 31 - 36 = 2

- מרווח 5: 37 - 42 = 2

- מרווח 6: 43 - 48 = 3

כאשר מוסיפים את התדירות המוחלטת של כל כיתה, זה חייב להיות שווה למספר הכולל של המדגם; במקרה זה, 30.

לאחר מכן מחושב התדירות היחסית של כל מרווח, המחלק את התדירות המוחלטת של מרווח זה במספר התצפיות הכולל:

- מרווח 1: פי = 9 ÷ 30 = 0.30

- מרווח 2: פי = 9 ÷ 30 = 0.30

- מרווח 3: fi = 5 ÷ 30 = 0.1666

- מרווח 4: פי = 2 ÷ 30 = 0.0666

- מרווח 5: = 2 = 30 = 0.0666

- מרווח 4: פי = 3 ÷ 30 = 0.10

לאחר מכן ניתן ליצור טבלה שמשקפת את הנתונים, וגם את התרשים מהתדר היחסי ביחס למרווחים המתקבלים, כפי שניתן לראות בתמונות הבאות:

בדרך זו, הכלל סטורג 'מאפשר לקבוע את מספר הכיתות או המרווחים שבהם ניתן לחלק מדגם, על מנת לסכם מדגם של נתונים באמצעות הכנת טבלאות וגרפים.

הפניות

  1. אלפונסו אורקויה, מ. ו. (2013). דוגמא וסימולציה של אירועים נפרדים. UNED,.
  2. אלטמן נעמי, מ. ק. (2015). "רגרסיה לינארית פשוטה." שיטות טבע .
  3. Antúnez, R. J. (2014). סטטיסטיקה בחינוך. UNID דיגיטלי.
  4. Fox, J. (1997.). ניתוח רגרסיה יישומית, מודלים ליניאריים ושיטות נלוות. פרסומי SAGE.
  5. Humberto Llinás Solano, C. R. (2005). סטטיסטיקה תיאורית והפצות הסתברות. אוניברסיטת צפון.
  6. Panteleeva, O. V. (2005). יסודות ההסתברות והסטטיסטיקה.
  7. O. Kuehl, M. O. (2001). עיצוב ניסויים: עקרונות סטטיסטיים של עיצוב וניתוח מחקר. תומסון העורכים.