گروه آماری دانش گستر

گروه آماری دانش گستر

جزئیات وبلاگ

image

خطای استاندارد میانگین (Standard error of mean)

خطای استاندارد میانگین

انحراف استاندارد به ما می­ گوید که چقدر میانگین معرف داده­ های نمونه است. هرچند، اگر در حال استفاده از میانگین نمونه برای برآورد میانگین (پارامتر) جامعه باشیم، پس نیاز به دانستن این هستیم آیا نمونه به خوبی مقادیر جامعه را نشان می دهد. این بویژه مهم است، زیرا اگر چندین نمونه را از یک جامعه انتخاب کنید، این نمونه­ ها کمی متفاوت خواهند بود. تصور کنید که علاقمند به ارزیابی همه مدرسان (بنابراین، مدرسان کل جامعه هستند) توسط دانشجویان بودیم. ما می­ توانیم یک نمونه را از این جامعه انتخاب کنیم و اگر این کار را کنیم، در واقع، در حال انتخاب یک نمونه از تعداد نمونه­ های ممکن هستیم. اگر چندین نمونه را از جامعه­ ی مشابه انتخاب کردیم، پس هر نمونه میانگین خودش را خواهد داشت و برخی از این میانگین نمونه­ ها متفاوت خواهند بود. شکل بالا فرایند انتخاب نمونه ها از یک جامعه را نشان می دهد. برای چند ثانیه تصور کنید که مقداری لوبیای سحرآمیز خوردیم که ما را به سطح سیاره­ای می­برد که از آنجا برای چند لحظه کوتاه، اما زیبا، می­توانیم همه مدرسان جهان را ارزیابی کنیم. به عنوان یک حقیقت مطلق می­دانیم که میانگین ارزیابی همه مدرسان برابر با 3 است (این میانگین جامعه است، µ، پارامتری که در تلاش هستیم، برآورد کنیم).

به جهان واقعی برگردید، به جامعه دسترسی نداریم. بنابراین، از نمونه استفاده می­کنیم و میانگین هر نمونه را محاسبه می ­کنیم. اجازه دهید تصور کنیم که نُه نمونه متفاوت را انتخاب کردیم (همانند شکل)؛ شما می توانید ببینید که تعدادی از نمونه ها میانگین مشابه و همانند جامعه دارند، اما تعدادی دیگر میانگین­های متفاوتی دارند. میانگین ارزیابی نمونه اول از مدرسان برابر با 3 بود، اما میانگین نمونه دوم تنها 2 بود. این تغییرات نمونه ­گیری را نشان می دهد: یعنی، نمونه ها تغییر خواهند کرد، زیرا آنها اعضای متفاوتی از جامعه را در بر می­ گیرند، یک نمونه که بر اساس شانس شامل تعدادی مدرس خیلی خوب می باشد، میانگین بالاتری نسبت به نمونه­ ای خواهد داشت که بر اساس شانس شامل تعدادی مدرس ضعیف است. اگر میانگین نمونه ها را به عنوان یک توزیع فراوانی، یا هیستوگرام ترسیم کنیم، می بینیم که سه نمونه وجود دارد که میانگین 3 دارند، دو نمونه میانگین 2 و 4 دارند، و میانگین 1 و 5 تنها در یک نمونه رخ داده است. نتیجه پایانی یک توزیع متقارن و خوش­آیند است که به عنوان توزیع نمونه ­گیری شناخته شده است. یک توزیع نمونه گیری، توزیع فراوانی میانگین نمونه­ ها (یا پارمتری که در حال تلاش برای برآورد آن هستید) از یک جامعه مشابه است. لازم است تصور کنید که در حال گرفتن صدها یا هزاران نمونه برای ساختن یک توزیع نمونه ­گیری هستیم- اما من تنها از نُه نمونه برای کشیدن نمودار استفاده کردم. توزیع نمونه ­گیری کمی مثل جانور افسانه­ ای تک شاخ است: ما می توانیم آن چیزی را که جانور تک شاخ به نظر می رسد تصور کنیم، می توانیم زیبایی آن را تحسین کنیم، و می توانیم از شاهکارهای جادوییش متعجب شویم، اما حقیقت غم انگیز این است که هرگز یک جانور تک شاخ را در واقعیت نمی بینید. هر دو آنها به صورت تصور، بجای چیزهای واقعی، وجود دارند. شما هرگز بیرون نخواهید رفت و واقعاً هزاران نمونه را جمع آوری نمی کنید و توزیع فراوانی میانگین های آنها را ترسیم نمی کنید؛ در عوض، آماریست های بسیار زرنگ روی آنچه این توزیع های به نظر می رسند، و نحوه عمل آنها کار می کنند.

توزیع نمونه­ گیری درباره رفتار نمونه ­های حاصل از جامعه به ما می گوید و متوجه خواهید شد که آن در اطراف مقدار عددی مشابهی مانند میانگین جامعه متمرکز شده است (یعنی، 3). بنابراین، اگر میانگین میانگین­های نمونه ها را حساب کنیم، مقدار میانگین جامعه را بدست خواهیم آورد. می توانیم از توزیع نمونه­ گیری استفاده کنیم تا به ما بگوید که نمونه چقدر معرف جامعه است. به بحث انحراف استاندارد فکر کنید. از انحراف استاندارد به عنوان یک شاخص اندازه­ گیری استفاده کردیم تا نشان دهیم میانگین چقدر معرف داده­ های مشاهده شده است. انحراف استاندارد کوچک شرایطی را نشان داد که در آن شرایط بیشتر نقاط داده­ها نزدیک به میانگین بودند، در حالی که یک انحراف استاندارد بزرگ موقعیتی را نشان داد که در آن نقاط داده­ ها به طور وسیعی از میانگین دور بودند. اگر «داده ­های مشاهده شده» میانگین نمونه ها باشند، پس انحراف استاندارد میانگین­ نمونه ها به طور مشابهی میزان پراکندگی میانگین نمونه ها را اطراف میانگین میانگین­ها به ما خواهد گفت (یعنی، میزان معرف بودن). در نظر داشته باشید که میانگین میانگین های نمونه ها همان میانگین جامعه است. بنابراین، انحراف استاندارد میانگین نمونه­ ها، میزان پراکندگی میانگین نمونه ­ها حول میانگین جامعه را به ما خواهد گفت: به عبارت دیگر، به ما می­ گوید آیا میانگین نمونه ­ها معرف میانگین جامعه هستند.

انحراف استاندارد میانگین­ نمونه­ها به عنوان خطای استاندارد میانگین (SE) یا خطای استاندارد شناخته شده است. در عالم خیال، خطای استاندارد می­تواند با محاسبه تفاوت بین میانگین هر نمونه و میانگین کل، مجذور کردن این تفاوت ها، جمع زدن آنها، و سپس تقسیم کردن بر تعداد نمونه ­ها محاسبه شود. در نهایت، جذر این مقدار برای بدست آوردن انحراف استاندارد میانگین­های نمونه ­ها، خطای استاندارد، لازم است. در دنیای واقعی، نمی توانیم صدها نمونه را جمع آوری کنیم. از این رو، بر تخمین خطای استاندارد تکیه می­ کنیم. خوشبختانه، تعدادی از آماریست­های فوق العاده باهوش چیزی را به نام نظریه حد مرکزی نشان داده ­اند. این نظریه به ما می­گوید که وقتی حجم نمونه­ ها بزرگتر می­ شوند (معمولاً به عنوان بیشتر از 30 تعریف شد)، توزیع نمونه ­گیری یک توزیع طبیعی با میانگین مساوی با میانگین جامعه است