אמצעי מגמה מרכזיים לנתונים מקובצים



ה מדדים של נטייה מרכזית של נתונים מקובצים הם משמשים בסטטיסטיקה כדי לתאר התנהגויות מסוימות של קבוצת נתונים שסופקו, כגון מה הם קרובים, מהו הממוצע של הנתונים שנאספו, בין היתר.

כאשר כמות גדולה של נתונים נלקח, כדאי לקבץ אותם יש סדר טוב יותר מהם ובכך יוכלו לחשב מדדים מסוימים של נטייה מרכזית.

בין האמצעים של נטייה מרכזית המשמשים ביותר הם הממוצע האריתמטי, החציון והמצב. מספרים אלה מציינים תכונות מסוימות לגבי הנתונים הנאספים בניסוי מסוים.

כדי להשתמש באמצעים אלה יש צורך קודם לדעת כיצד לקבץ קבוצה של נתונים.

נתונים מקובצים

כדי לקבץ נתונים תחילה עליך לחשב את טווח הנתונים, המתקבל על ידי הפחתה של הערך הגבוה ביותר בניכוי הערך הנמוך ביותר של הנתונים.

לאחר מכן בחר מספר "k", שהוא מספר השיעורים שבהם ברצונך לקבץ את הנתונים.

אנו ממשיכים לחלק את טווח בין "k" כדי לקבל את משרעת של הכיתות להיות מקובצים. מספר זה הוא C = R / k.

לבסוף הקבוצה מתחילה, אשר מספר קטן יותר מהערך הקטן ביותר של הנתונים שהתקבלו נבחר..

מספר זה יהיה הגבול התחתון של המחלקה הראשונה. לתוספת זו ג. הערך המתקבל יהיה הגבול העליון של המחזור הראשון.

לאחר מכן, C נוסף לערך זה ואת הגבול העליון של המחלקה השנייה מתקבל. בדרך זו אתה ממשיך עד שאתה מקבל את הגבול העליון של המעמד האחרון.

לאחר הנתונים מקובצים אתה יכול להמשיך לחשב את הממוצע, חציון ואופנה.

כדי להמחיש את הממוצע האריתמטי, החישוב והמצב מחושבים, נמשיך בדוגמה.

דוגמה

לכן, בעת קיבוץ הנתונים תקבל טבלה כמו הבאה:

3 הנטייה המרכזית המרכזית

עכשיו נמשיך לחשב את הממוצע האריתמטי, החציון והמצב. הדוגמה לעיל ישמש להמחשת הליך זה.

1- ממוצע אריתמטי

הממוצע האריתמטי מורכב מכפלה של כל תדר על ידי הממוצע של המרווח. לאחר מכן כל התוצאות הללו מתווספים, ולבסוף מחולקים לפי הנתונים.

בדוגמה הקודמת נקבל שהממוצע האריתמטי שווה ל:

(4 + 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

זה מציין כי הערך הממוצע של הנתונים בטבלה הוא 5.11111.

2-5 בינוני

כדי לחשב את החציון של קבוצת נתונים, תחילה כל הנתונים מסודרים לפחות מהגבוה ביותר. ניתן להציג שני מקרים:

- אם מספר הנתונים הוא מוזר, אז החציון הוא הנתונים הנכונים במרכז.

- אם מספר הנתונים הוא אפילו, אז החציון הוא הממוצע של שני הנתונים שנותרו במרכז.

כשמדובר בנתונים מקובצים, חישוב החציון נעשה באופן הבא:

- N / 2 מחושב, כאשר N הוא סך הנתונים.

- המרווח הראשון מתבצע חיפוש שבו התדר המצטבר (סכום התדרים) גדול מ N / 2, והגבול התחתון של מרווח זה, הנקרא Li, נבחר..

החציון ניתן על ידי הנוסחה הבאה:

Me = Li + (Ls-Li) * (N / 2 - תדר מצטבר לפני לי) / תדירות [Li, Ls]

Ls הוא הגבול העליון של הטווח שהוזכר לעיל.

אם טבלת הנתונים הנ"ל משמשת זה חייב N / 2 = 18/2 = 9. תדרים מצטברים הם 4, 8, 14 ו 18 (אחד עבור כל שורה של הטבלה).

לכן, המרווח השלישי צריך להיות נבחר, שכן התדירות המצטברת עולה על N / 2 = 9.

אז Li = 5 ו- L = 7. החלת הנוסחה המתוארת לעיל, עליך:

= 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3 אופנה

אופנה היא הערך שיש לו את התדירות הגבוהה ביותר בין כל הנתונים מקובצים; כלומר, הערך הוא חזר על עצמו פעמים רבות במערך הנתונים הראשונית.

כאשר יש לך כמות גדולה מאוד של נתונים, הנוסחה הבאה משמשת לחישוב מצב הנתונים המקובצים:

מו = Li + (LS-Li) * (תדר Li - תדירות L (i-1)) / ((תדר Li - תדירות L (i-1)) + (תדר Li - תדירות L ( i + 1)))

המרווח [Li, Ls] הוא המרווח שבו נמצא התדר הגבוה ביותר. עבור הדוגמה שנעשתה במאמר זה יש לנו כי האופנה ניתנת על ידי:

(5 - 5) 5 + 2 * 2/4 = 5 + 1 = 6.

נוסחה נוספת המשמשת כדי להשיג ערך משוער אופנה הוא כדלקמן:

(תדר L + i) 1 (+ L) (L = L).

בנוסחה זו, החשבונות הם כדלקמן:

(5 + 5) + 4/4 = 4 = 5 + 2 * 4/8 = 5 + 1 = 6.

הפניות

  1. Bellhouse, D. R. (2011). אברהם דה מוברה: הגדרת שלב ההסתברות הקלאסית ויישומיה. לחץ על CRC.
  2. Cifuentes, J. F. (2002). מבוא לתורת ההסתברות. האוניברסיטה הלאומית של קולומביה.
  3. Daston, L. (1995). ההסתברות הקלאסית להארה. הוצאת אוניברסיטת פרינסטון.
  4. Larson, H. J. (1978). מבוא לתורת ההסתברות והסקירה הסטטיסטית. עריכה לימוזה.
  5. Martel, P. J., & Vegas, F. J. (1996). הסתברות ונתונים סטטיסטיים מתמטיים: יישומים בתחום הקליני וניהול הבריאות. אדיציונס דיאז דה סנטוס.
  6. Vázquez, A. L., & Ortiz, F. J. (2005). שיטות סטטיסטיות למדוד, לתאר ולשנות השתנות. אד, אוניברסיטת קנטבריה.
  7. Vázquez, S. G. (2009). מתמטיקה ידני לגישה לאוניברסיטה. מרכז העריכה של רמון.