گروه اجتماعی - فاطمهنجفی در یادداشتی نوشت: در شبکههای اجتماعی مجموعهای آمار تحت عنوان نتایج «گزارش نظرسنجی درباره نگرش ایرانیان به دین» توسط موسسه «گمان» منتشر شده است. که با استفاده از شیوهی نمونهگیری snow ball در اینترنت انجام شده است. این گزارش نتایج خود را به افراد بالای ۱۹ سال و یا سواد در کشور تعمیم دادهاست.
به گزارش بولتن نیوز، با توجه به محدودیتهای snow ball sampeling و محدودیت دسترسی به اینترنت و فعالیت در شبکههای اجتماعی، به نظرمیرسه این نظر سنجی مستعد تورشهای جدی هست ک با روشهای «تکنیکال» دم دستی برای حل تورشهای نمونهگیری snow ball sampelling- که در پیوست گزارش ذکر شده است - قابلیت تعمیم -ولو به جامعه باسواد بالا ۱۹ سال ایرانی- پیدا نمیکنه.
اول در مورد مساله دسترسی به انیترنت و بعد داده محذوف در نمونهگیری کمی صحبت کنیم
————
براساس نظرسنجیهای ایسپا و نتایج طرح آمارگیری برخورداری خانوارها و استفاده از فنآوری اطلاعات و ارتباطات:
فقط ۶۹ درصد افرادی که تلفن همراه دارند گوشی لمسی دارند و ۵۸.۴ میلیون نفر گوشی همراه دارند یعنی ۵۱ درصد جمعیت احتمالا به شبکههای اجتماعی دسترسی ندارند اگر این را از منظر خانوار ببینیم میشه ۴۰٪!!!. از منظر دیگر هم اگر ببینیم ۴۲.۶ درصد خانوارهای کشور به یارانه (تبلت، لپتاپ، دسکتاپ) دسترسی نداشتند. و مستقیم تر از همه فقط ۵۵ درصد خانوارهای کشور به اینترنت دسترسی داشتند این تصور که افراد بالای ۱۹ سال و باسواد که در شبکه اجتماعی به یک سوال پاسخ دادند قابلیت تعمیم به ۸۵ درصد جامعه را دارند دور از واقع هست.
—————
اما اینکه از منظر تنکیکی مشکل کجاست:
داده از دست رفته یا محذوف در نمونهگیریها سه شکل دارد
1. Comeletely Missing at Random (CMAR)
یعنی دادههایی که نداریم کاملا تصادفیست بنابراین در نتیجهگیریهای ما در مورد خروجیها اثر نمیگذارد
2. MAR: Missing at Random
عاملی که باعث missing data شده روی خروجی مورد نظر طرح اثر داره. اما اثر اون قابل کنترل هست. یعنی با متغیرهایی دیگری میشه اون را کنترل کرد، وزندهی کرد و یا به وسیله متغیرهای ابزاری اثرش را دید. روشهایی که به ما در تعمیم نتایج نمونه گلوله برفی به جامعهای که نمونهگیری ازش انجام شده کمک میکنه از چنین «مفهمومی» استفاده میکنند
۳. NMAR: non missing at Random
یعنی علاوه بر اینکه عامل نداشتن داده تصادفی نیست، متغیر(ها)ی که بر حذف داده تاثیر گذاشتند مشاهدهپذیر یا شناخته شده یا کنترپذیر نیستند. و در این صورت نتایج ما بایاس خواهند بود.
در مورد نمونهگیری اسنوبال موسسه گمان با مشکل NMAR رو به روییم. و مساله بدتر اینه که «نمیدونیم» اون متغیر(های) که missing record را ایجاد کردند چی هستند. راهحلهای محدودیتهاب خود snowball samplingقابلیت تعمیم به کل جامعه را برامون فراهم نمیکنه.
در این شرایط با نمونهگیری به شکل بالا حتا با اندازه ۵۰۰ هزار نفر احتمال حل تورشهای ذاتی اسنوبال با روشهایی که ذکر کردند وجود نداره
اینجا حتا استفاده از روشهایی مثل متغیر ابزاری هم به شدت محدودیت داره. چون وقتی میخواهید با متغیر(های) دیگه اثر دادههای از دست رفته روی خروجی نظرسنجی را ببینید به سه شرط احتیاج دارید
1. Relevance
2. exclusion restriction
3. monotonicity
)اولی میگه باید با متغیر محذوفتون مرتبط باشه (مثل همین دسترسی/عدم دسترسی به اینترنت( دومی میگه جز از مسیر متغیر محذوف تو ایجاد مسیسنگ دیتا جور دیگری به نتیجه نظرسنجی مربوط نشه و سومین شرط میگه جهت اثرش تغیر نکنه (مثلا تو یک گروه باعث جواب دادن تو یک گروه جواب ندادن نشه)
مهمترین شهودی که برای تورش این نظرسنجی میشه داشت کم بودن افرادی هست که خودشون را اهل تسنن اعلام کردند. و این را مرتبط با دسترسی به اینترنت میدونم چون مثلا دسترسی به اینترنت در استانهایی مانند سیستان و بلوجستان به شدت پایینتر از متوسط کشوری هست.
اما!
.اگر دولت نتایج/خلاصه طرحهای معتبر مثل طرح ملی سنجش سرمایه اجتماعی کشور را در دسترس عموم قرار میداد، برخی از این ادعاها قابلیت سنجش پیدا میکرد. و یا امکان ساختن متغیرهای ابزاری و غیره برای کنترل اثر عوامل مختلف به وجود میآمد.
شما می توانید مطالب و تصاویر خود را به آدرس زیر ارسال فرمایید.
bultannews@gmail.com