دانشمندان علاقمند
به کشف چیزی درباره یک پدیده هستند که فرض میکنیم
واقعاً وجود دارد (یک پدیده در دنیای واقعی). این پدیده در دنیای واقعی ممکن است
هر چیزی از وضع نرخ بهره در بازار اقتصادی تا رفتار دانشجویان در مراسم فارغ التحصیلی
باشد. هنگامی که تمایل به توضیح پدیده ای داریم، داده هایی را از دنیای واقعی جمع
آوری می کنیم تا فرضیههای خود را درباره پدیده بیازماییم.
آزمودن این فرضیهها شامل ساختن مدلهای آماری پدیده مورد علاقه است.
دانشمندان کارهایی مشابه با مهندس
انجام میدهند؛ آنها مدلهای (آماری) از فرایندهای جهان واقعی میسازند تا نحوه
عمل این فرایندها را در شرایط معین پیش بینی کنند (کادر 2-1 را ببینید). هرچند،
برخلاف مهندس، ما به موقعیت دنیای واقعی دسترسی نداریم. بنابراین، تنها میتوانیم
همیشه چیزهایی درباره ی فرایندهای روانشناسی، اجتماعی، زیست شناختی، و اقتصاد بر
اساس مدلهای که می سازیم، استنباط کنیم. هرچند، دقیقاً مانند یک مهندس، میخواهیم
مدل هایمان تا حد ممکن چنان دقیق باشند که بتوانیم مطمئن شویم که پیش بینی هایمان
درباره ی جهان واقعی نیز دقیق هستند؛ مدل آماری که می سازیم باید معرف دادههای
(داده های مشاهده شده) باشند که با بیشترین دقت ممکن جمع آوری شدهاند. درجه ای که
یک مدل آماری دادههای جمع آوری شده را نشان می دهد، به عنوان برازش مدل شناخته شده است.
شکل سه مدل را نشان می دهد که ممکن است یک مهندس بسازد تا پل دنیای واقعی مورد نظر را نشان دهد. مدل اول (الف) یک بازنمایی دقیق از وضعیت دنیای واقعی است و برازش خوبی دارد. اگر مهندس از این مدل برای پیش بینی جهان واقعی استفاده کند، به دلیل اینکه مدل خیلی شبیه جهان واقعی است، میتواند مطمئن باشد که این پیش بینی ها دقیق خواهند بود. بنابراین، اگر مدل در نتیجه ی یک باد قوی فرو بریزد، به احتمال خیلی زیاد پل واقعی نیز فرو خواهد ریخت. مدل دوم (ب) با دنیای واقعی مقداری شباهت دارد؛ مدل برخی از ویژگی های ساختاری پایه را دربرمی گیرد، اما برخی تفاوتهای بزرگ با پل دنیای واقعی نیز دارد (برای مثال، یکی از برج های حمایت کننده را ندارد). ممکن است این مدل را دارای برازندگی متوسط در نظر بگیریم (یعنی، با واقعیت شباهتهای دارد، اما برخی تفاوتهای مهم نیز وجود دارد). اگر مهندس از این مدل برای پیش بینی دنیای واقعی استفاده کند، ممکن است این پیش بینی ها دقیق نباشند و حتی احتمال وقوع فاجعه وجود دارد (برای مثال، مدل پیش بینی می کند که پل در نتیجه ی باد قوی فرو خواهد ریخت (به این دلیل عملیات ساخت پل متوقف می شود، ایجاد 100 مایل خط طولی با هر استانداردی در برف غیرضروری بود، زیرا پل واقعی به طور کامل ایمن بود-مدل یک بازنمایی بد از واقعیت بود). ما میتوانیم مقداری اطمینان، اما نه اطمینان کامل، به پیش بینی ها از روی این مدل داشته باشیم. مدل پایانی (ج) کاملاً با وضعیت جهان واقعی متفاوت است. آن هیچ شباهت ساختاری با پل واقعی ندارد و برازش ضعیفی دارد. همه ی پیش بینی ها بر اساس این مدل به احتمال زیاد کاملاً نادرست هستند. با بسط دادن این قیاس به علوم اجتماعی، اگر مدلمان یک برازش ضعیف از داده های مشاهده شده باشد، پس پیش بینی ها از آن به همان اندازه ضعیف خواهد بود.