برای محاسبه دامنه ، شما باید بزرگترین مقدار مشاهده شده از یک متغیر (حداکثر) را پیدا کنید و کوچکترین مقدار مشاهده شده (حداقل) را کم کنید. دامنه فقط این دو مقدار را در نظر می گیرد و نقاط داده بین دو اندام توزیع را نادیده می گیرد. از آن به عنوان مکمل اقدامات دیگر استفاده می شود ، اما بندرت به عنوان تنها اندازه گیری پراکندگی مورد استفاده قرار می گیرد زیرا به مقادیر شدید حساس است.
دامنه interquartile و محدوده نیمه مداخله ایده بهتری از پراکندگی داده ها را نشان می دهد. برای محاسبه این دو اقدام ، باید مقادیر کوارتیل های پایین و فوقانی را بدانید. کوارتیل پایین یا کوارتیل اول (Q1) ، مقداری است که در آن 25 ٪ از نقاط داده هنگام مرتب سازی به ترتیب در حال افزایش است. کوارتیل فوقانی یا کوارتیل سوم (Q3) ، مقداری است که براساس آن 75 ٪ از نقاط داده هنگام ترتیب در حال افزایش نظم یافت می شود. میانه دومین کوارتیل (Q2) در نظر گرفته می شود. دامنه interquartile تفاوت بین کوارتل های فوقانی و تحتانی است. محدوده نیمه متناوب نیمی از محدوده بین قشر است.
هنگامی که مجموعه داده کوچک است ، شناسایی مقادیر کوارتل ها ساده است. بیایید به یک مثال نگاه کنیم.
مثال 1 - دامنه و دامنه بین مجموعه یک مجموعه داده
کوارتل های این مجموعه داده ها را پیدا کنید: 6 ، 47 ، 49 ، 15 ، 43 ، 41 ، 7 ، 39 ، 43 ، 41 ، 36.
شما ابتدا باید نقاط داده را به ترتیب افزایش دهید. با انجام این کار ، می توانید به آنها رتبه ای بدهید تا موقعیت آنها را در مجموعه داده ها نشان دهند. رتبه 1 نقطه داده با کوچکترین مقدار است ، رتبه 2 نقطه داده با مقدار کمترین مقدار و غیره است.
درجه | ارزش |
---|---|
1 | 6 |
2 | 7 |
3 | 15 |
4 | 36 |
5 | 39 |
6 | 41 |
7 | 41 |
8 | 43 |
9 | 43 |
10 | 47 |
11 | 49 |
سپس باید رتبه متوسط را پیدا کنید تا داده های مجموعه را به دو بخش تقسیم کنید. همانطور که در بخش میانه مشاهده کردیم ، اگر تعداد نقاط داده یک ارزش ناهموار باشد ، رتبه متوسط خواهد بود
(n + 1) ÷ 2 = (11 + 1) ÷ 2 = 6
رتبه متوسط 6 است ، به این معنی که از هر طرف پنج امتیاز وجود دارد.
سپس برای یافتن کوارتیل پایین ، باید نیمه پایین داده ها را دوباره به دو تقسیم کنید. کوارتیل پایین نقطه رتبه (5 + 1) ÷ 2 = 3. نتیجه Q1 = 15 است. نیمه دوم نیز باید در دو تقسیم شود تا مقدار کوارتیل فوقانی را پیدا کند. رتبه کوارتیل فوقانی 6 + 3 = 9 خواهد بود. بنابراین Q3 = 43.
پس از داشتن کوارتل ها ، می توانید به راحتی گسترش را اندازه گیری کنید. دامنه interquartile Q3 - Q1 خواهد بود که 28 (43-15) می دهد. دامنه نیمه Interquartile 14 (2 28 28) و دامنه 43 (49-6) است.
برای مجموعه داده های بزرگتر ، می توانید از توزیع فرکانس نسبی تجمعی استفاده کنید تا به شناسایی کوارتل ها یا حتی بهتر ، توابع اصلی آمار موجود در یک صفحه گسترده یا نرم افزار آماری کمک کند که به راحتی نتیجه می دهد.
چه اتفاقی می افتد که مجموعه داده شامل یک نقطه داده باشد که مقدار آن در مقایسه با بقیه توزیع شدید در نظر گرفته می شود؟
مثال 2 - دامنه و دامنه بین قشر در حضور یک مقدار شدید
دامنه و دامنه بین مجموعه داده های مثال 1 را پیدا کنید ، که یک نقطه داده از مقدار 75 به آن اضافه شده است.
این محدوده اکنون 69 (75-6) خواهد بود. میانگین میانگین مقادیر داده نقطه داده رتبه 12 ÷ 2 = 6 و نقطه داده رتبه (2 12 12) + 1 = 7 است. زیرا بین رده های 6 و 7 قرار دارد ، شش نقطه داده وجود دارددر هر طرف میانه. کوارتیل پایین میانگین مقادیر نقطه داده رتبه 6 ÷ 2 = 3 و نقاط داده رتبه (2 6 6) + 1 = 4. نتیجه (15 + 36) ÷ 2 = 25. 5 است. کوارتیل فوقانی میانگین مقادیر نقطه داده رتبه 6 + 3 = 9 و نقطه داده رتبه 6 + 4 = 10 است که (43 + 47) ÷ 2 = 45 است.= 19. 5.
به طور خلاصه ، این محدوده از 43 به 69 رفت ، که افزایش 26 در مقایسه با مثال 1 ، فقط به دلیل یک مقدار شدید. دامنه بین قشر قوی تر از 28 به 19. 5 رفت و تنها 8. 5 کاهش یافت.
مثال دوم نشان داد که دامنه بین قشر نسبت به دامنه قوی تر است وقتی مجموعه داده شامل مقداری است که به نظر می رسد شدید است. این یک اقدام عالی نیست. در این مثال ، ما ممکن است انتظار داشته باشیم که هنگام افزودن یک مقدار شدید ، اندازه گیری پراکندگی افزایش یابد ، اما برعکس اتفاق می افتد زیرا بین مقادیر داده های داده های رده های 3 و 4 تفاوت زیادی وجود دارد.
این سری پنج ارزش که توسط حداقل ، سه کوارتیل و حداکثر آن به عنوان "خلاصه پنج شماره" تشکیل می شود. خلاصه مجموعه داده ها یک روش شناخته شده است. در بخش زیر در طرح جعبه و ویسکر ، یک روش مفید برای تجسم این خلاصه پنج شماره خواهیم دید.