در باب دقت نظرسنجی‌های انتخاباتی

مطالب این ستون، صرفاً آرای نویسندگان آن را بازتاب می‌دهد.
۲۳ خرداد ۱۳۹۲
امید حاتمی - دانشجوی ریاضی در دانشگاه کمبریج
 
 

طی چند روز گذشته نظرسنجی موسوم به آی‌پُز[1] در اینترنت دست به دست شده است. در این میان، بسیاری به نتایج این نظرسنجی به دیده تردید نگاه کرده‌اند. این نوشتار قصد دارد به نظرسنجی‌های انتخاباتی مختلف نگاهی بیندازد و در مورد خطاهای ممکن بحث کند. فرض می‌کنم که افراد پرسش‌شونده راست می‌گویند و موسسات نظرسنجی صادقانه نظرات را گزارش می‌کنند.

۱. انتخاب جامعه آماری: اکثر نظرسنجی‌های اینترنتی در ایران غیرمعتبر هستند. دلیل این امر این است که جامعه آماری[2] کاربران اینترنت نمونه‌ای تصادفی از جمعیت کل کشور نیست. گزارش مرکز آمار ایران[3] ادعا می‌کند که اکثر کاربران اینترنت در ایران نوجوانان و جوانان هستند. همچنین ضریب نفوذ در استان‌هایی همچون تهران، اصفهان و آذربایجان شرقی بیشتر است و در استان‌های سیستان و بلوچستان و کرمان و خراسان جنوبی اینترنت ضریب نفوذ کمتری دارد[4]. اگر بخواهیم به این واقعیات، این که چه جامعه آماری از یک سایت خاص بازدید می‌کنند را هم اضافه کنیم، اعتبار اکثر نظرسنجی‌های آماری را به خاطر ناهمگون بودن زیر سوال می‌رود.

ادعا شده که ضریب نفوذ تلفن همراه در ایران ۹۱ درصد است[5]. همین امر موجب می‌شود که جامعه‌ای آماری دارندگان تلفن یک جامعه آماری مناسب برای نظرسنجی پنداشته شود. اگرچه همواره انتقاداتی همچون سویه نتیجه نظرسنجی به نفع کسانی که تلفن دارند و یا کسانی که در زمان نظرسنجی در کنار تلفن‌شان بودند و یا فرصت پاسخ به تلفن را داشتند وجود دارد، ولی یک جواب به این انتقاد این است که بین این موارد و نتیجه سوال نظرسنجی همبستگی قوی وجود ندارد.

۲. اندازه نمونه و نحوه نمونه‌گیری: بسیاری از نظرسنجی‌‌ها با ادعای این که نمونه رای‌گیری آن‌ها بزرگ‌تر از نظرسنجی‌های دیگر است، خود را معتبرتر از نظرسنجی‌های دیگر می‌دانند. در واقع آن‌چه بیش از اندازه نمونه اهمیت دارد نحوه نمونه گیری[6] است. نظرسنجی‌های اینترنتی در واقع دچار نمونه‌ای از تعصب نمونه‌ای [7] به نام تعصب خود گزینی[8] هستند و اصلی‌ترین مشکل آن‌ها این است که نمونه آماری خود انتخاب می‌کند که در نظرسنجی شرکت کند یا نه. یک روش مناسب این است که از جامعه آماری به صورت یکنواخت و تصادفی نمونه‌گیری کنیم[9]. بسیاری از نظرسنجی‌های معتبر همچون گالوپ[10] و راسموسن[11] از تماس تلفنی تصادفی[12] از بین یک لیست از شماره تلفن‌ها استفاده می‌کنند.

در مورد اندازه نمونه‌گیری هم شاید در نگاه اول نابدیهی به نظر آید که که چگونه یک نمونه هزار نفری می‌تواند آرای یک جمعیت ۷۰ میلیونی را با این دقت تقریب بزند. قضیه اعداد بزرگ بیان می‌کند[13] که میانگین نتیجه نمونه‌گیری تصادفی از یک متغیر تصادفی به میانگین امید ریاضی آن متغیر تصادفی میل می‌کند. تری تائو[14] ریاضی‌دان استرالیایی در این پست[15] وبلاگ‌اش سعی می‌کند توضیح دهد که بدون توجه به این که یک جامعه آماری چقدر بزرگ باشد، یک نظرسنجی با نمونه‌گیری هزار نفری اگر تصادفی انتخاب شود، می‌تواند نتایج یک انتخابات را با ۹۵ درصد اطمینان و ۳ درصد خطا پیش‌بینی کند. اگر بخواهم به صورت شهودی در مورد قضیه اعداد بزرگ توضیح بدهم شبیه این می‌ماند که انگشتم را در آب دریاچه‌ای فرو کنم و با فرو کردن آن در دهانم به میزان شوری آب پی ببرم.

۳. نحوه رای‌گیری آی‌پُز: مسئولین آی‌پُز ادعا می‌کنند که با استفاده از یک بانک اطلاعاتی شماره تلفن و شماره‌یابی تصادفی (احتمالا با روش [12]) با مردم ایران تماس می‌گیرند. نتایج نظرسنجی از میانگین نتایج چهار روز اخیر[16] منتشر می‌شود.

نکته دیگر این‌که در مورد اطمینان ۹۵ درصد و خطای ۳ درصد باید دقت بیشتری کرد. بنابر نامساوی هفدینگ[17] احتمال این‌که میانگین ۱۰۶۷ نمونه از یک متغیر تصادفی در فاصله‌ی اطمینان ۵ درصد از امید ریاضی این متغیر تصادفی قرار بگیرد برابر است با ۹۵ درصد. روش‌هایی وجود دارد که می‌توان این این درصد اطمینان را بهتر کرد و در نهایت میانگین ۱۰۶۷ نمونه از یک متغیر تصادفی با احتمال ۹۵ درصد در فاصله اطمینان ۳ درصد از امید ریاضی قرار می‌گیرد.[18] در نتیجه با توجه به وجود شش کاندیدا، می‌توان گفت که احتمال این که همه آرای منتشره در سه درصدی آن‌چه منتشر شده قرار بگیرند حداقل برابر است با ۷۰ درصد، که ضریب اطمینان را پایین‌تر می‌آورد.

با این حال هنوز می‌توان از نتایج این نظرسنجی اطلاعاتی با ضریب اطمینان بالا استخراج کرد. مثلا با توجه به این‌که در نظرسنجی آی‌پُز در تاریخ ۲۲ خرداد ادعا شده که درصد آرای منتشره  ۳۲.۴ درصد و آرای قالیباف ۲۴.۶ درصد است، اگر فرضیات بالا صحیح باشند و ادعایشان صحت داشته باشد و البته شبهات زیر نادیده گرفته شود، می‌توان به این نتیجه رسید که به احتمال حداقل ۹۰ درصد روحانی از قالیباف جلوتر است.

۴. شبهات: سعی می‌کنم در پایان به چند مورد از شبهه‌هایی که به دقت نظرسنجی آی‌پُز وارد است، اشاره کنم و تاثیر آن‌ها را در دقت نظرسنجی بررسی کنم:

- میزان مشارکت در این نظرسنجی: این میزان در نظرسنجی آی‌پُز بالای ۷۰ درصد اعلام شده است. همان‌طور که گزارش به این موضوع اشاره می‌کند، اگر درصد بالایی از کسانی را که از پاسخ به سوالات امتناع کرده‌اند، معادل کسانی فرض شوند که از شرکت در انتخابات سرباز زده‌اند، آن‌گاه میزان مشارکت کاهش پیدا می‌کند. همچنین این امکان وجود دارد که بین کسانی که از شرکت در نظرسنجی خودداری کرده‌اند و طرف‌داران یک کاندید خاص همبستگی وجود داشته باشد.

- احتمال همبستگی بین آرای تصمیم نگرفته و یک کاندید خاص: امکان دارد بین کسانی هنوز تصمیم نگرفته‌اند و کسانی که به یک کاندیدای خاص متمایل هستند، همبستگی وجود داشته باشد. با توجه به درصد بالای آرای تصمیم نگرفته، همین موضوع می‌تواند در نتایج خطا ایجاد کند. فکر مي‌کنم یکی از دلایل افزایش شدید آرای روحانی در نتیجه نظرسنجی در روز ۲۱ خرداد به خاطر این باشد که بسیاری از کسانی که هنوز تصمیم نگرفته بودند (و احتمالا بین عارف و روحانی مردد بودند) پس از انصراف عارف به نفع روحانی انصراف دادند.

- عدم صداقت افراد پرسش‌شونده: ادعا شده که برخی از افراد پرسش‌شونده به دلیل ملاحظات شخصی دروغ می‌گویند و این می‌تواند در نتیجه نظرسنجی خدشه وارد کند. متاسفانه راهی برای حل این موضوع به ذهنم نمی‌رسد.

- صداقت آی‌پُز و احتمال عددسازی: برخی ادعا کرده‌اند که آمار اعلام شده عددسازی شده و برخی نیز صحت و صداقت گزارش آی‌پُز را زیر سوال برده‌اند. تاکنون موفق شده‌ام برخی از ادعاهای عددسازی را رد کنم، ولی اگر این ادعا ثابت شود، این امر می‌تواند صحت و اعتبار کل گزارش آی‌پُز را زیر سوال ببرد.

1. http://www.ipos.me/
2. http://en.wikipedia.org/wiki/Statistical_population
3. http://www.amar.org.ir/Portals/0/Files/abstract/1389/n_IT_89.pdf
4. http://www.iriu.ir/matma/
5. http://hamshahrionline.ir/details/146580
6. http://en.wikipedia.org/wiki/Sampling_(statistics)
7. http://en.wikipedia.org/wiki/Sampling_bias
8. http://en.wikipedia.org/wiki/Self-selection
9. http://en.wikipedia.org/wiki/Simple_random_sample
10. http://www.gallup.com/strategicconsulting/156923/worldwide-research-methodology.aspx
11. http://www.rasmussenreports.com/public_content/about_us/methodology
12. http://en.wikipedia.org/wiki/Random_digit_dialing
13. http://en.wikipedia.org/wiki/Law_of_large_numbers
14. https://en.wikipedia.org/wiki/Terence_Tao
15. http://terrytao.wordpress.com/2008/10/10/small-samples-and-the-margin-of-error/
تری تائو در این پست قضیه‌ای ضعیف‌تر را اثبات می‌کند، ولی به روش اثبات ادعای مورد نظر هم اشاره می‌کند.
16. البته در نظرسنجی ۲۱ خرداد از سه روز اخیر استفاده شده و این احتمالا به خاطر این است که پس از انصراف عارف و حداد عادل نتایج به شدت تغییر کرده‌اند و برای همین وزن نتایج چهار روز پیش صفر محاسبه شده.
17. http://en.wikipedia.org/wiki/Hoeffding's_inequality
18. http://www.americanresearchgroup.com/moe.html

این مقاله از صفحه گوگل پلاس آقای حاتمی برداشته شده است:‌
 https://plus.google.com/103217178959963443419/posts/NhfijcMkjv7


نظرسنجی‌های روزانه ما را به صورت ایمیل دریافت کنید

ثبت نام