گروه آماری دانش گستر

گروه آماری دانش گستر

جزئیات وبلاگ

image

مدل های آماری خطی یا غیر-خطی

مدل های آماری خطی یا غیر-خطی

دانشمندان (بویژه دانشمندان علوم اجتماعی و رفتاری) گرایش به توصیف داده ها با مدل های خطی دارند که مدل هایی مبتنی بر خط راست هستند. ادبیات علمی با تحقیقاتی سردرگم شده اند که از تحلیل واریانس (ANOVA) و رگرسیون برای تحلیل داده­ه ا استفاده می کنند. این مدل ها سیستم های یکسانی بر پایه مدل های خطی دارند (کوهن، 1968). اما آنها نام­های متفاوتی دارند و، حداقل در روان شناسی، به دلیل بخش بندی های تاریخی در روش شناسی عمدتاً در زمینه های متفاوتی استفاده شده ­اند (کرونباخ، 1957).
اجازه دهید یک مثال را بررسی کنیم، آزمایشگاه راستگویی روش ارزیابی اعمال نادرست توسط افراد را مورد بررسی قرار داد. شرکت کنندگان نادرستی اعمال را بر اساس تماشای ویدئوهای از افرادی که مرتکب آن اعمال شده بودند، ارزیابی کردند. من نتایج را در نشریه ­ی دانشگاهی ندیده ­ام، اما رسانه ها دارند ما را متقاعد می­ سازند که مجرمی که دوست داشتنی­تر بود، اعمال نادرستش به طور مثبتی دیده شد. تصور کنید 10 نفر را انتخاب کردیم و عمل نادرستی، توصیف شده توسط مجرم، را به طور تصادفی به آنها نشان دادیم. از آنها خواستیم تا صداقت عمل (از 0= رفتار مخوف تا 10=واقعاً خوب است) و میزان علاقه شان به شخص  (اصلاً=0 و خیلی زیاد=10) را ارزیابی کنند.  
ما می توانیم این داده های فرضی را روی نمودار پراکنش نشان دهیم که در این نمودارها هر نقطه معرف ارزیابی فرد بر اساس هر دو متغیر است. شکل بالا دو  نسخه از داده­های یکسان را نشان می دهد، اما در نمودار سمت چپ، برازش مدل خطی (راست) و نمودار سمت راست،  برازش مدل غیر خطی (منحنی الشکل) است. این نمودارها نشان می دهند چگونه می توانیم انواع متفاوتی از مدل ها را با داده های مشابهی مطابقت دهیم. هر دو نمودار نشان می دهند که بیشتر افرادی که مجرم را دوست دارند، به طور مثبت تری اعمال نادرست آنها را ارزیابی می کنند. هرچند، خط منحنی الشکل الگوی دقیق­تری را نشان می دهد: گرایش به بخشش افراد دوست داشتنی، در واقع، هنگامی بیشتر می شود که ارزیابی میزان دوست داشتن بالاتر از 4 باشد. پایین 4 (هنگامی که افراد واقعاً دوست داشتنی نیستند) همه اعمال را نسبتاً پایین ارزیابی می کنند (خط قرمز نسبتاً صاف است)، اما هنگامی که دوست داشتنی می شوند (تقریباً بالاتر از 4)، شیب خط تندتر می شود، یعنی، وقتی دوست داشتنی بودن از این مقدار بالاتر می رود، افراد به طور فزاینده ای نسبت به اعمال نادرست بخشنده­تر می­شوند. هر دو مدل اساساً درست است، اما یک مدل نسبت به مدل دیگر داده ها را بهتر برازش می­کند و به همین دلیل است که وقتی از مدل­های آماری استفاده می­کنیم، ارزیابی میزان تناسب یک مدل معین با داده ها مهم است.
مدل های خطی تمایل دارند تا با داده­ها برازش پیدا کنند، زیرا پیچیدگی کمتری دارند. این ممکن است دو نوع سوگیری ایجاد کند: (1) بیشتر مدل ها در ادبیات علمی ممکن است بهترین مدل برای برازش با داده ها نباشند (زیرا مولفین مدل های غیر-خطی را امتحان نمی کنند) و (2) ممکن است داده­های بسیاری به دلیل برازش ضعیف مدل خطی، و تسلیم شدن دانشمندان و عدم امتحان مدل غیر-خطی، چاپ نشده باشند (شاید برازش مدل غیر-خطی خوب بوده باشد). بنابراین، ترسیم داده­ها در ابتدا مفید است: اگر نمودارتان به نظر می رسد مدل غیر-خطی را پیشنهاد می کند، پس این احتمال را بررسی کنید.