برآورد یکی از اهداف مهم امار استنباطی است، ما معمولاً علاقمند
به استفاده از میانگین نمونه به عنوان برآوردی از پارامتر (برای مثال، میانگین)
جامعه هستیم. عیناً دیده ایم که برآورد پارامتر (برای مثال، میانگین) بین نمونه ها متفاوت خواهد
بود و می توانیم از خطای استاندارد استفاده کنیم تا از میزان تفاوت بین این
برآوردها آگاه شویم. همچنین، می توانیم از این اطلاعات برای محاسبه محدوده
هایی استفاده کنیم که عقیده داریم میانگین جامعه در این محدوده ها قرار خواهد
گرفت. چنین محدود هایی فواصل اطمینان نامیده
شده اند. هرچند، آنچه توصیف می کنم، برای هر پارامتری کاربرد
دارد، اما میانگین را دوباره مثال خواهیم زد تا همخوانی با مطالب گذشته حفظ شود.
دامجن ، بلسبویس ،
و ویلیامز (1998) رهاسازی آموخته شده
اسپرم را در بلدرچین ژاپنی آزمایش کردند. ایده پایه این بود که اگر به یک بلدرچین
اجازه داده شود که در یک زمینه معین (اطاق آزمایشگاه) با یک بلدرچین ماده مقاربت
جنسی داشته باشد، این زمینه به عنوان نشانه مقاربت جنسی بکار می رود و به
نوبت خود بر رهاسازی اسپرم اثر خواهد گذاشت. در هر صورت، اگر میانگین مقدار اسپرم
رها شده در اطاق آزمایشگاه را بررسی کنیم، یک میانگین واقعی (میانگین در جامعه)
وجود دارد؛ اجازه دهید تصور کنیم این مقدار 15 میلیون اسپرم است. اکنون، در نمونه
واقعی خودمان، ممکن است بیابیم میانگین مقدار اسپرم رها شده 17 میلیون بود. چون که
میانگین واقعی را نمی دانیم، واقعاً نمی دانیم آیا مقدار 17 میلیون در نمونه یک
برآورد خوب یا ضعیف از این ارزش عددی است. بنابراین، بجای تمرکز بر یک مقدار واحد
در نمونه، می توانیم از یک برآورد فاصله ای استفاده کنیم: از میانگین نمونه به
عنوان نقطه میانی استفاده می کنیم، اما حدود پایین و بالا را نیز تعیین می کنیم.
بنابراین، می توانیم بگوییم،
فکر می کنیم مقدار
واقعی میانگین رهاسازی اسپرم تقریباً بین 12 تا 22 میلیون اسپرم است (توجه داشته
باشید که 17 میلیون به طور دقیق بین این مقادیر عددی قرار می گیرد). البته، در این مورد،
مقدار واقعی (15 میلیون) نیز در بین این حدودها قرار می¬= گیرد. هرچند، چه می شود اگر
حدود کوچکتر را تعیین کنیم، چه می شود اگر بگوییم که فکر می کنیم مقدار واقعی بین 16 تا 18
میلیون قرار می گیرد
(دوباره، توجه داشته باشید که 17 میلیون در میانه است)؟ در این مورد، فواصل مقدار
واقعی میانگین را در بر نمی-گیرد. حالا اجازه دهید تصور کنیم که آزمایش را 50 بار با استفاده از نمونه های مختلف تکرار کردید. هر بار
که آزمایش را انجام دادید، دوباره یک فاصله اطراف میانگین نمونه، دقیقاً همانگونه
که در بالا توصیف کردم، ساختید. شکل این سناریو را نشان می دهد؛ دایره ها میانگین
هر نمونه را با خطوطی بیرون آمده از آنها نشان می دهند که این خطوط معرف فواصل این
میانگین ها هستند. مقدار واقعی میانگین (میانگین جامعه) 15 میلیون است و با خط
عمودی نشان داده شده است. اولین نکته قابل توجه این است که میانگین نمونه ها از میانگین
واقعی متفاوت هستند (این به خاطر تغییرات نمونه گیری است، همانگونه در بخش قبلی
توصیف شد). دوماً، اگر چه بیشتر فواصل، میانگین واقعی را در بر می گیرند (آنها که
خط عمودی را قطع می کنند، یعنی؛ مقدار 15 میلیون اسپرم تا حدی بین حدود بالا و پایین
قرار می گیرد)، اما
تعدادی نیز اینچنین نیستند.
نکته مهم برای
ساختن فواصل اطمینان در چنین روشی این است که آنها چیزهای مفیدی را به ما می گویند.
بنابراین، فواصل اطمینان را چنان محاسبه می کنیم که دارای ویژگی های معینی باشند؛ بویژه
آنها به ما بگویند که چقدر احتمال دارد مقدار واقعی پارامتر در حال برآورد (در این
مورد، میانگین) را دربرگیرند. بطور معمول
فواصل اطمینان 95 % و گاهی فواصل اطمینان 99 % را بکار می بریم، اما همه آنها تفسیر
مشابهی دارند؛ آنها محدودههایی هستند که چنان ایجاد شده اند که مقدار واقعی پارامتر
جامعه در درون این محدوده ها برای درصد معینی از نمونه ها (95 درصد یا 99 درصد)
قرار خواهند گرفت. بنابراین، هنگامی که فاصله اطمینان %95 را برای میانگین می بینید، اینگونه
به آن فکر کنید؛ اگر 100 نمونه را جمع آوری کنیم، میانگین هر نمونه را حساب کنیم و سپس فاصله اطمینان
میانگین را محاسبه کنیم ( تا حدی شبیه شکل)، این فواصل اطمینان، مقدار واقعی میانگین
جامعه را در 95 نمونه از این 100 نمونه دربرخواهند گرفت.
برای محاسبه فاصله
اطمینان نیاز به شناختن حدودهای داریم که در آن حدودها 95 درصد میانگین ها قرار
خواهند گرفت. ما (در نمونه های بزرگ) می دانیم که توزیع نمونه گیری میانگین ها طبیعی است و توزیع طبیعی به
طور دقیقی چنان تعریف شده است که میانگین 0 و انحراف استاندارد 1 دارد. ما می توانیم از این
اطلاعات برای محاسبه احتمال وقوع یک نمره یا حدودی که درصد معینی از نمرات بین
آنها قرار می گیرند، استفاده کنیم. از مثال نحوه محاسبه حدودی که %95 نمرات در آن حدود قرار می
گیرند؛ استفاده کردم که دقیقاً آن چیزی است که نیاز به دانستن داریم، اگر می خواهیم
فاصله اطمینان %95 ایجاد کنیم. فهمیدیم که %95 نمره های-z بین 1/96- و 1/96 قرار می گیرند. خوشبختانه، بر اساس نظریه حد مرکزی می دانیم که در نمونه های بزرگ (بیشتر
از 30) توزیع نمونه گیری طبیعی خواهد بود. متاسفانه بعید است
که میانگین و انحراف استاندارد 0 و 1 باشند- به همین دلیل باید نمرات را با
استفاده از معادله زیر تبدیل کنیم تا میانگین 0 و انحراف استاندارد 1 (نمرات-z) داشته باشند:
z=(X-M)/s
z=(X-M)/s
بنابراین، موقعی که انحراف استاندارد (s در معادله بالا) و میانگین (M در معادله) معلوم باشند، فاصله اطمینان می تواند به آسانی محاسبه شود. هرچند، ما از خطای استاندارد، نه انحراف استاندارد، استفاده میکنیم، زیرا به تغییرپذیری میانگین نمونه ها، نه تغییرپذیری در مشاهدات درون نمونه، علاقمند هستیم. بنابراین، حد پایینی فاصله اطمینان مساوی است با میانگین منهای 1/96 ضربدر خطای استاندارد و حد بالا مساوی است با میانگین به اضافه 1/96 ضربدر خطای استاندارد:
(SE×1/96)- M=حد پایینی فاصله
اطمینان
(SE×1/96)+ M=حد بالایی فاصله
اطمینان
به همین صورت، میانگین همیشه در مرکز فاصله اطمینان است. می دانیم که فاصله اطمینان 95 درصدی میانگین واقعی را در برمی¬گیرد. بنابراین، می توانیم فرض کنیم این فاصله اطمینان میانگین واقعی را دربرمی¬گیرد؛ لذا اگر فاصله کوچک باشد، میانگین نمونه باید خیلی نزدیک به میانگین واقعی باشد. در مقابل، اگر فاصله اطمینان خیلی وسیع باشد، پس میانگین نمونه ممکن است از میانگین واقعی خیلی متفاوت باشد؛ یعنی، آن یک معرف بد از جامعه است.
بنابراین، برای برآورد فواصل اطمینان
1. خطای استاندارد (SE) نمونه را از تقسیم انحراف استاندارد بر جذر تعداد نمونه بدست بیاورید
2. سطح اطمینان برآورد را مشخص کنید آیا با 95 درصد یا 99 درصد اطمینان قصد برآورد را دارید؟
3. مقدار Z سطح اطمینان تعیین کنید اگر با 95 درصد اطمینان قصد برآورد دارید نمره Z برابر با 1.96- و 1.96+ است اگر با 99 درصد اطمینان قصد برآورد دارید نمره Z برابر با 2.58- . 2.58+
4. خطای استاندارد نمونه در نمره z ضرب کنید
5. در نهایت، حاصلضرب مرحله چهار یک بار به میانگین نمونه اضافه کنید یک بار کم کنید بنابراین، به دو عدد می رسد که فواصل اطمینان نامیده می شوند، و ما می توانیم بگوییم با 95 درصد اطمینان میانگین جامعه بین دو عدد فواصل اطمینان قرار دارند
مثال
محققی قصد دارد میانگین قد دانشجویان تربیت بدنی را براورد کنیدو بدین منظور تعداد 25 نفر را دانشجویان تربیت بدنی را انتخاب می کند، اگر میانگین و انحراف استاندارد قد این نمونه برابر با 175 و 5 باشد، با 99 درصد اطمینان میانگین قد دانشجویان تربیت بدنی را برآورد کنید؟
برای برآورد و رسیدن به فواصل اطمینان،
1) ابتدا خطای استاندارد را محاسبه می کنیم، همانطور که در بالا گفته شده است، خطای استاندارد از تقسیم انحراف استاندارد (S) بر جذر تعداد نمونه (N) بدست می آید، انحراف استاندارد در این مثال برابر با 5 و تعداد برابر با 25 است، جذر 25 می شود، 5. بنابراین، 5 تقسیم بر 5 می شود، 1. خطای استاندارد میانگین برابر با 1 است
2) سطح اطمینان برابر با 99 درصد است، نمره Z برای سطح اطمینان 99 درصد برابر با 2.58 است
3. خطای استاندارد در نمره Z سطح اطمینان 99 درصد ضرب می کنیم؛ 1 ضربدر 2.58 مساوی با 2.58 می شود
4. حاصلضرب در مرحله قبل یکبار از میانگین نمونه کم و یکبار به میانگین اضافه می کنیم، میانگین قد برابر با 175 سانتی متر بود، یکبار 2.58 از میانگین قد کم می کنیم می شود، 172.42؛ 2.58 یکبار به میانگین قد اضافه می کنیم، می شود 177.58. بنابراین،برآورد ما می شود، با 99 درصد اطمینان میانگین قد دانشجویان تربیت بدنی بین 172.42 سانتی متر تا 177.58 سانتی متر است.
دو عدد 172.42 و 177.58 فواصل اطمینان نامیده می شوند