گروه آماری دانش گستر

گروه آماری دانش گستر

جزئیات وبلاگ

image

نظریه حد مرکزی و طبیعی بودن توزیع داده ها


نظریه حد مرکزی و طبیعی بودن توزیع داده ها

تصور کنید یک جامعه از نمراتی داریم که به طور طبیعی توزیع نشده­ اند. شکل بالا چنین جامعه­ ای شامل نمرات تعداد دوستان اساتید آمار را نشان می­ دهد: این جامعه دارای کجی زیادی است، بیشتر اساتید تنها یک دوست دارند، فراوانی­ها با افزایش تعداد دوستان به حداکثر 7 دوست در حال کاهش است. شما را فریب نمی ­دهم؛ همانگونه که به نظر می­ رسد، این جامعه تا اینجا از منحنی طبیعی زنگوله ی شکل دور شده است. تصور کنید که نمونه ­های با حجم 5 استاد از این جامعه انتحاب کردیم و در هر نمونه یک پارامتر (مثل میانگین) را برآورد کردیم و سپس نمرات را جایگزین کردیم. در حقیقت، 5000 نمونه انتخاب کردیم، و در نتیجه 5000 مقدار برآورد پارامتر داریم (هر یک از یک نمونه متفاوت). اجازه دهید بررسی کنیم چه اتفاقی می افتد وقتی این 5000 مقدار عددی را در توزیع فراوانی ترسیم کنیم. توزیع فراوانی 5000 برآورد پارامتر از 5000 نمونه در سمت چپ شکل نشان داده شده است. این توزیع نمونه ­گیری برآورد پارامتر است. توجه کنید که کاملاً دارای کجی است، اما به اندازه جامعه دارای کجی نیست. اکنون تصور کنید که فرایند نمونه ­گیری را تکرار کردیم، اما اینبار نمونه­ های من هر یک 30 نمره را بجای تنها 5 نمره در برگرفتند. توزیع نهایی 5000 برآورد در مرکز شکل است. هنوز کجی در توزیع نمونه گیری وجود دارد، اما نسبت به زمانی که نمونه ها مبتنی بر تنها 5 نمره بودند، خیلی طبیعی ­تر است. در نهایت، کل فرایند را تکرار کردم، اما این بار نمونه ­های با حجم 100 نمره بجای 30 نمره انتخاب کردم. توزیع نهایی 5000 برآورد پارامتر، اساساً طبیعی است (سمت راست شکل). همانگونه که اندازه نمونه بزرگتر می­شود، توزیع نمونه­ گیری طبیعی ­تر می­ شود تا نقطه ­ای که در آن نقطه نمونه به اندازه کافی بزرگ است که توزیع نمونه ­گیری طبیعی باشد (علیرغم این حقیقت که جامعه نمرات واقعاً غیر طبیعی بود). این نظریه حد مرکزی است: بدون توجه به شکل جامعه، توزیع برآوردهای پارامتر آن جامعه طبیعی خواهند بود، بشرط آنکه نمونه ها به اندازه کافی بزرگ باشند. 

بنابراین، وقتی حجم نمونه تحقیق بالاتر از 30 نفر است، بر اساس نظریه حد مرکزی می توانید توزیع داده ها را طبیعی یا نرمال فرض کنید.