گروه آماری دانش گستر

گروه آماری دانش گستر

جزئیات وبلاگ

image

برازش (fit)

مفهوم برازش چیست؟ مدل از برازش مناسبی برخوردار است؟ یعنی چی؟

دانشمندان علاقمند به کشف چیزی درباره یک پدیده هستند که فرض می­کنیم واقعاً وجود دارد (یک پدیده در دنیای واقعی). این پدیده در دنیای واقعی ممکن است هر چیزی از وضع نرخ بهره در بازار اقتصادی تا رفتار دانشجویان در مراسم فارغ ­التحصیلی باشد. هنگامی که تمایل به توضیح پدیده ­ای داریم، داده هایی را از دنیای واقعی جمع آوری می­ کنیم تا فرضیه­های خود را درباره پدیده بیازماییم. آزمودن این فرضیه­ها شامل ساختن مدل­های آماری پدیده مورد علاقه است. 

 اجازه دهید با یک قیاس شروع کنم، تصور کنید یک مهندس قصد ساختن یک پل روی رودخانه را دارد. این مهندس خیلی نادان خواهد بود، اگر دقیقاً پل قدیمی را بسازد، زیرا ممکن است فرو بریزد. در عوض، مهندس از دنیای واقعی، داده ­هایی را جمع آوری می کند: او پل های موجود را بررسی می کند و می بیند که آنها از چه موادی ساخته شده­ اند و ساختار و اندازه آنها و موارد دیگر را بررسی می کند (حتی ممکن است داده­ هایی درباره اینکه آیا این پل­ها هنوز پابرجا هستند، جمع­ آوری کند). او از این اطلاعات برای ساختن یک ایده از آنچه پل جدیدش خواهد بود (این یک مدل است)، استفاده می کند. ساختن یک مدل با اندازه واقعی از پل پرهزینه و غیرعملی است. بنابراین، او یک مدل کوچک از پل را می­سازد، ممکن است مدل از واقعیت به چند دلیل متفاوت باشد-مدل ساخته شده برای شروع کوچکتر خواهد بود- اما مهندس برای ساختن مدلی که با موقعیت­های مورد علاقه بر اساس داده های موجود تناسب بهتری داشته باشد، تلاش خواهد کرد. وقتی که مدل ساخته شد، می تواند برای پیش­ بینی چیزهایی درباره ­ی جهان واقعی از آن استفاده کند. برای مثال، ممکن است مهندس پایداری پل را در برابر بادهای قوی با قرار دادن آن در داخل تونل باد بیازماید. این مهم است که تعیین شود آیا مدل یک بازنمایی دقیق از دنیای واقعی است یا نتیجه گیری ها بر اساس مدل را نمی توان به پل واقعی تعمیم داد.

دانشمندان کارهایی مشابه با مهندس انجام می­دهند؛ آنها مدل­های (آماری) از فرایندهای جهان واقعی می­سازند تا نحوه عمل این فرایندها را در شرایط معین پیش­ بینی کنند (کادر 2-1 را ببینید). هرچند، برخلاف مهندس، ما به موقعیت دنیای واقعی دسترسی نداریم. بنابراین، تنها می­توانیم همیشه چیزهایی درباره ­ی فرایندهای روان­شناسی، اجتماعی، زیست شناختی، و اقتصاد بر اساس مدل­های که می­ سازیم، استنباط کنیم. هرچند، دقیقاً مانند یک مهندس، می­خواهیم مدل هایمان تا حد ممکن چنان دقیق باشند که بتوانیم مطمئن شویم که پیش­ بینی هایمان درباره ­ی جهان واقعی نیز دقیق هستند؛ مدل آماری که می­ سازیم باید معرف داده­های (داده های مشاهده شده) باشند که با بیشترین دقت ممکن جمع آوری شده­اند. درجه ای که یک مدل آماری داده­های جمع آوری شده را نشان می دهد، به عنوان برازش مدل شناخته شده است.

شکل  سه مدل را نشان می دهد که ممکن است یک مهندس بسازد تا پل دنیای واقعی مورد نظر را نشان دهد. مدل اول (الف) یک بازنمایی دقیق از وضعیت دنیای واقعی است و برازش خوبی دارد. اگر مهندس از این مدل برای پیش­ بینی جهان واقعی استفاده کند، به دلیل اینکه مدل خیلی شبیه جهان واقعی است، می­تواند مطمئن باشد که این پیش بینی ها دقیق خواهند بود. بنابراین، اگر مدل در نتیجه ­ی یک باد قوی فرو بریزد، به احتمال خیلی زیاد پل واقعی نیز فرو خواهد ریخت. مدل دوم (ب) با دنیای واقعی مقداری شباهت دارد؛ مدل برخی از ویژگی های ساختاری پایه را دربرمی گیرد، اما برخی تفاوتهای بزرگ با پل دنیای واقعی نیز دارد (برای مثال، یکی از برج ­های حمایت کننده را ندارد). ممکن است این مدل را دارای برازندگی متوسط در نظر بگیریم (یعنی، با واقعیت شباهت­های دارد، اما برخی تفاوت­های مهم نیز وجود دارد). اگر مهندس از این مدل برای پیش بینی دنیای واقعی استفاده کند، ممکن است این پیش­ بینی­ ها دقیق نباشند و حتی احتمال وقوع فاجعه وجود دارد (برای مثال، مدل پیش بینی می کند که پل در نتیجه ­ی باد قوی فرو خواهد ریخت (به این دلیل عملیات ساخت پل متوقف می شود،  ایجاد 100 مایل خط طولی با هر استانداردی در برف غیرضروری بود، زیرا پل واقعی به طور کامل ایمن بود-مدل یک بازنمایی بد از واقعیت بود). ما می­توانیم مقداری اطمینان، اما نه اطمینان کامل، به پیش بینی­ ها از روی این مدل داشته باشیم. مدل پایانی (ج) کاملاً با وضعیت جهان واقعی متفاوت است. آن هیچ شباهت ساختاری با پل واقعی ندارد و برازش ضعیفی دارد. همه­ ی پیش بینی ها بر اساس این مدل به احتمال زیاد کاملاً نادرست هستند. با بسط دادن این قیاس به علوم اجتماعی، اگر مدلمان یک برازش ضعیف از داده های مشاهده شده باشد، پس پیش­ بینی ها از آن به همان اندازه ضعیف خواهد بود.