برای آزمون فرضیه نیاز به جمع آوری داده داریم، برای
جمع آوری داده نیاز به اندازه گیری داریم، در اصل، نیاز به تصمیم گیری درباره دو چیز
داریم : (1) چه چیزی اندازهگیری می شود، و (2) نحوه اندازه گیری آن.
پاسخ اینکه چه چیز اندازه گیری می شود،
به اندازه کافی آسان است: برای آزمون فرضیه ها نیاز به اندازه گیری متغیرها
داریم. متغیرها فقط ویژگی هایی هستند که می توانند تغییر کنند (یا تغییر داد)؛
آنها ممکن است بین افراد (مانند، هوش، رفتار) یا مکان ها (مانند، بیکاری) یا حتی
زمان (مثل، خلق و خو، سود، تعداد سلولهای سرطانی) تغییر کنند. بیشتر فرضیه ها می
توانند بر حسب دو متغیر بیان شوند: یک علت پیشنهادی و یک نتیجه پیشنهادی. برای
مثال، اگر اظهار علمی «چای سبز، یک چربیسوز موثر است» در نظر بگیریم، پس علت پیشنهادی چای
سبز است و نتیجه پیشنهادی کاهش چربی است. علت و نتیجه، هر دو متغیر هستند: برای
علت می توانیم نوع چای را تغییر دهیم، و برای معلول، این چای ها مقدار متفاوتی از
چربی را خواهند سوزاند. سنجش این دو متغیر، کلید آزمون این اظهار علمی است.
متغیری که فکر می کنیم علت است، به عنوان متغیر
مستقل شناخته شده است (زیرا ارزش آن به ارزش هیچ متغیر دیگری وابسته نیست). متغیری
که فکر می کنیم معلول است، متغیر وابسته نامیده می شود، زیرا ارزش این متغیر
وابسته به علت (متغیر مستقل) است. این واژه ها به طرح های تجربی به طور بسیار نزدیکی
گره خورده اند که در این طرح ها علت واقعاً توسط محقق دستکاری می شود. هرچند،
محققان همیشه متغیرهای مستقل را نمی توانند دستکاری کنند (برای مثال، اگر بخواهید
ببینید آیا سیگار کشیدن موجب سرطان ریه می شود، یک گروه از افراد را در اتاق برای
30 سال حبس و وادار به سیگار کشیدن نخواهید
کرد). بنابراین، گاهی آنها بجای تحقیقات تجربی از
تحقیقات علی-مقایسه ای و همبستگی
استفاده می کنند. در این زمینه، صحبت کردن از متغیرهای مستقل و وابسته قابل فهم نیست،
زیرا همه متغیرها در اصل متغیرهای وابسته هستند. من ترجیح می دهم از واژه های متغیر
پیش بین و متغیر ملاک بجای متغیرهای مستقل و وابسته استفاده کنم. این یک تمایل شخصی
نیست، در کار تجربی علت (متغیر مستقل) یک متغیر پیش بین است، و معلول (متغیر
وابسته) یک متغیر ملاک است. در تحقیق همبستگی می توانیم از یک یا چند متغیر (پیش بین)
جهت پیش بینی (حداقل از نظر آماری) یک یا چند متغیر ملاک حرف بزنیم.