מחלקה מארק על מה שהיא פועלת, איך זה נלקח דוגמאות



ה המותג המעמד, הידוע גם בשם נקודת האמצע, הוא הערך שנמצא במרכז הכיתה, המייצג את כל הערכים הנמצאים באותה קטגוריה. ביסודו של דבר, סימן הכיתה משמש לחישוב פרמטרים מסוימים, כגון הממוצע האריתמטי או סטיית התקן.

לאחר מכן, סימן הכיתה הוא נקודת האמצע של כל מרווח. ערך זה הוא גם מאוד שימושי עבור מציאת השונות של קבוצת נתונים ו מקובצי כיתות, אשר בתורו מאפשר לנו להבין כמה רחוק מהמרכז הם הנתונים אלה שנקבעו.

אינדקס

  • 1 התפלגות התדרים
    • 1.1 כמה שיעורים לשקול?
  • 2 איך מגיעים?
    • 2.1 דוגמה
  • 3 מה זה??
    • 3.1 דוגמה
  • 4 הפניות

התפלגות התדרים

כדי להבין מה המותג של הכיתות, הרעיון של התפלגות תדר הוא הכרחי. בהינתן מערך נתונים, התפלגות התדרים היא טבלה המחלקת נתונים אלה למספר קטגוריות הנקראות כיתות.

טבלה זו מראה מהו מספר האלמנטים השייכים לכל כיתה; האחרון נקרא תדר.

טבלה זו מציגה חלק מהמידע שאנו מקבלים מן הנתונים הקריב, כי במקום שיש את ערך הפרט של כל פריט, אנחנו רק יודעים שהוא שייך לאותו מעמד.

מצד שני, אנו מקבלים הבנה טובה יותר של הנתונים להגדיר, שכן בדרך זו קל יותר להעריך דפוסי הוקמה, אשר מקל על מניפולציה של נתונים אלה..

כמה שיעורים לשקול?

כדי לבצע התפלגות תדר עלינו תחילה לקבוע את מספר הכיתות שאנחנו רוצים לקחת ולבחור את גבולות הכיתה של אותם.

הבחירה של כיתות כמה צריך להילקח בנוחות, בהתחשב שמספר קטן של כיתות יכול להסתיר מידע על הנתונים שאנחנו רוצים ללמוד אחד מאוד גדול יכול לייצר יותר מדי פרטים כי הם לא בהכרח מועיל.

הגורמים שיש לקחת בחשבון בעת ​​בחירת כמה שיעורים לקחת הרבה כמה, אבל בין שני אלה להתבלט: הראשון הוא לקחת בחשבון כמה נתונים שאנחנו צריכים לשקול; השני הוא לדעת מה גודל הוא הטווח של ההפצה (כלומר, ההבדל בין התצפית הגדולה והקטנה).

לאחר שהשיעורים כבר הוגדרו, נמשיך לספור כמה נתונים קיימים בכל כיתה. מספר זה נקרא תדר מחלקה והוא מסומן על ידי פי.

כפי שאמרנו בעבר, יש לנו כי התפלגות התדר מאבד את המידע שמגיע בנפרד מכל נתונים או תצפית. לכן, מבקשים ערך המייצג את כל הכיתה שאליה היא שייכת; ערך זה הוא המותג של שיעורים.

איך אתה מקבל?

סימן המחלקה הוא הערך המרכזי של המחלקה. הוא מתקבל על ידי הוספת גבולות המרווח וחלוקת ערך זה בשניים. זה יכול להביע מתמטית כדלקמן:

xi= (גבול תחתון + גבול עליון) / 2.

בביטוי זה xi מסמן את הסימן של מעמד ith.

דוגמה

בהינתן הנתונים הבאים, הגדר התפלגות נציג תדרים וקבל את הסמן המתאים.

כמו הנתונים עם הערך המספרי הגבוה ביותר הוא 391 ואת הקטן ביותר הוא 221, יש לנו את הטווח הוא 391 -221 = 170.

אנו נבחר 5 כיתות, כל עם אותו גודל. אחת הדרכים לבחור את השיעורים היא כדלקמן:

שים לב שכל הנתונים נמצאים בכיתה, הם מפרידים ויש להם אותו ערך. דרך נוספת לבחור את השיעורים היא לשקול את הנתונים כחלק ממשתנה רציף, אשר יכול להגיע לכל ערך אמיתי. במקרה זה אנו יכולים לשקול שיעורים של הטופס:

205-245, 245-285, 285-325, 325-365, 365-405

עם זאת, דרך זו של קיבוץ נתונים יכול להציג עמימות מסוימת עם גבולות. לדוגמה, במקרה של 245, מתעוררת השאלה: לאיזה מעמד היא שייכת, הראשונה או השנייה??

כדי למנוע את הבלבול הזה מתכנסת נקודת קיצון. בדרך זו, המחזור הראשון יהיה מרווח (205,245), השני (245,285), וכן הלאה.

לאחר שהשיעורים מוגדרים, אנו ממשיכים לחשב את התדירות ויש לנו את הטבלה הבאה:

לאחר קבלת התפלגות התדר של הנתונים, אנו ממשיכים למצוא את סימני הכיתה של כל מרווח. למעשה, עלינו:

x1= (205 + 245) / 2 = 225

x2= (245 + 285) / 2 = 265          

x3= (285 + 325) / 2 = 305

x4= (325+ 365) / 2 = 345

x5= (365+ 405) / 2 = 385

אנו יכולים לייצג זאת על ידי הגרפיקה הבאה:

בשביל מה??

כאמור, המותג הוא מעמד פונקציונלי מאוד כדי למצוא את הממוצע אריתמטי והשונה של ערכות נתונים שקובצו למעמדות שונות.

אנו יכולים להגדיר את הממוצע האריתמטי כסכום התצפיות המתקבלות בין גודל המדגם. מבחינה פיזית, הפרשנות שלה היא כמו נקודת שיווי המשקל של מערך נתונים.

זיהוי קבוצה שלמה של נתונים על ידי מספר אחד יכול להיות מסוכן, ולכן עלינו לקחת בחשבון גם את ההבדל בין נקודת שיווי המשקל לבין הנתונים האמיתיים. ערכים אלה ידועים כסטייה מהממוצע האריתמטי, ועם אלו אנו מבקשים לקבוע עד כמה משתנה האריתמטיקה של הנתונים.

הדרך הנפוצה ביותר למצוא ערך זה היא השונות, שהיא הממוצע של הריבועים של הסטיות מהממוצע האריתמטי.

כדי לחשב את הממוצע האריתמטי ואת השונות של קבוצת נתונים מקובצים בכיתה נעשה שימוש בנוסחאות הבאות, בהתאמה:

בביטויים אלה xi  הוא i-th בכיתה המותג, וi מייצג את התדירות המקבילה ואת k את מספר הכיתות שבהן הנתונים היו מקובצים.

דוגמה

באמצעות הנתונים שניתנו בדוגמה הקודמת, אנו יכולים להרחיב את הנתונים של טבלת חלוקת התדרים קצת יותר. אתה מקבל את הדברים הבאים:

לאחר מכן, כאשר מחליפים את הנתונים בנוסחה, עזבנו שהממוצע האריתמטי הוא:

השונות וסטיית התקן הם:

מכאן ניתן להסיק שלנתונים המקוריים יש ממוצע אריתמטי של 306.6 וסטיית תקן של 39.56.

הפניות

  1. פרננדז פ. סנטיאגו, קורדובה ל. אלחנדרו, Cordero S. Jose M. תיאורי סטטיסטיקה. Esic עריכה.
  2. ג 'ונסון ריצ' רד א מילר ו - Pround הסתברות ו מדינאים עבור מהנדסים.
  3. מילר אני & פרוינד ג 'ההסתברות ואת מדינאים עבור מהנדסים. Reverte.
  4. סראביה א. חוסה מריה, פסקואל מרתה. קורס סטטיסטי בסיסי לחברות
  5. Llinás S. Humberto, Rojas A. Carlos סטטיסטיקה תיאורית והסתברות הסתברותית. Universidad del Norte עריכה