خطایی مشهور در استدلال‌های احتمالاتی [پی‌نوشت دارد]

کتابِ ریاضیاتِ سالِ دهم (دبیرستان) بحثِ کوتاهی در احتمال دارد. اینکه دانش‌آموزانِ من همگی باهوش و خوب‌اند به من امکانِ این تجمل را داده است که، قبل از ورود به محتوای رسمیِ آموزش‌وپرورش، دو جلسه‌ی کامل را به مسائلِ مشهوری در احتمال بپردازم:‌ یکی برای نشان‌دادنِ اینکه تعریفِ احتمال در فضاهای نامتناهی اصلاً بدیهی نیست، دومی برای نشان‌دادنِ اینکه شهودهای اولیه‌ی ما گاهی به‌شدت بر خطا است. (این دومی را بعد از معرفیِ احتمالِ شرطی به شکلِ قاطعانه‌ای حل‌وفصل کردیم، و به نظرم دیدنِ اینکه قضیه‌ای ریاضی می‌تواند مناقشه‌ای را برطرف کند تجربه‌ی مطبوعی بوده باشد.)
 
اما مسأله‌ی سومی هم مطرح کردیم که، با اینکه از جنسِ دو مسأله‌ی اول نبود و به‌سرعت متقاعد شدیم که جوابِ صحیح‌اش چیست، صحبت با دوستانِ غیرریاضی‌دان متقاعدم کرد که انتشارش در اینجا می‌تواند مفید باشد. مسأله مقدماتی و مشهور است، اما ظاهراً (دست‌کم در اطرافِ من) چندان شناخته‌شده نیست. 
 
فرض کنید آزمایشی برای بیماری‌ای داریم که دقت‌اش بالا و مثلاً 98 درصد است، به این معنا که
 
اولاً‌ مثبتِ کاذب‌‌اش 2 درصد است: در فقط 2 درصد از موارد اگر کسی سالم باشد آزمایشْ او را بیمار اعلام می‌کند (پس در 98 درصد از موارد، اگر کسی سالم باشد آزمایش او را سالم اعلام می‌‌کند)؛ و ثانیاً منفیِ کاذب‌اش هم 2 درصد است: در فقط 2 درصد از موارد، اگر کسی بیمار باشد آزمایش او را سالم اعلام می‌کند (پس در 98 درصد از موارد، اگر کسی بیمار باشد آزمایش او را بیمار اعلام می‌کند).
 
حالا سؤال این است: فرض کنیم شخصی را به‌تصادف انتخاب کرده‌ایم و آزمایش کرده‌ایم و جوابْ مثبت بوده است (یعنی آزمایش می‌گوید که او بیمار است)؛ چقدر احتمال دارد که او واقعاً بیمار باشد؟ 
 
اگر جواب‌تان 98 درصد است دارید اشتباه می‌کنید. یک راهِ پی‌بردن به اشتباهْ این است که تعریفِ "مثبتِ کاذب" را با دقت بخوانید و ببینید که درباره‌ی این است که اگر کسی سالم باشد آنگاه آزمایش با چه احتمالی او را بیمار اعلام می‌کند، اما سؤالِ ما عکسِ این را می‌پرسد: می‌پرسد که اگر آزمایشْ کسی را بیمار اعلام کند، آنگاه او با چه احتمالی بیمار است. اما بگذارید جورِ ملموس‌تری به این موضوع بپردازیم. 
 
فرض کنیم جمعیتِ جامعه سیصدمیلیون باشد، و فرض کنیم که دومیلیون نفر از این افراد دچارِ بیماری‌ای باشند که داریم در موردِ آزمایشِ تشخیص‌اش صحبت می‌کنیم. حالا فرض کنیم که اصلاً از همه‌ی این جمعیتِ سیصد‌میلیونی آزمایش بگیریم. نتیجه چه می‌شود؟
 
۱. از بینِ دومیلیون بیمار، 1,960,000 نفرشان بیمار اعلام می‌شوند (چون منفیِ کاذب 0.02 است)؛
۲. از بینِ دویست‌ونودوهشت‌میلیون سالم، 5,960,000 نفرشان بیمار اعلام می‌شوند (چون مثبتِ کاذب 0.02 است).
 

پس تعدادِ کلّ کسانی که بیمار اعلام می‌شوند برابر است با 7,920,000، در حالی که (بنا به فرض) تعدادِ کلّ بیمارانِ واقعی 2,000,000 است. این یعنی اینکه فقط 25.25 درصد از کسانی که بیمار اعلام می‌شوند واقعاً بیمار هستند. اگر شخصی به‌تصادف انتخاب شده باشد و این آزمایش در موردش بگوید که بیمار است، به احتمالِ نزدیک به هفتادوپنج درصد او بیمار نیست. 

جوابِ سؤالِ اصلیِ ما این است: بستگی دارد به اینکه چه درصدی از کلّ جمعیتْ بیمار باشند.

پی‌نوشت (پنجمِ اسفند). در یادداشت‌ها به‌درستی تذکر دادند که در محاسبات اشتباهی رخ داده بود. اعداد اصلاح شد، به شکلی که حالا دقتِ آزمایش 98 درصد است (مثبتِ کاذب و منفیِ کاذب حالا هر دو 2 درصد فرض شده‌اند). ارجاع به آمارِ آلودگی به اچ‌آی‌وی در ایالاتِ متحده را حذف کردم. و به گمان‌ام حرفِ اصلی هنوز برجا است: این سؤال که اگر نتیجه مثبت اعلام شود احتمالِ آلودگی چقدر است جواب‌اش  وابسته است به نسبتِ تعدادِ آلوده‌شدگان به کلّ جمعیت—مثلاً با عددهای ذکرشده و با دقتِ نودوهشت‌درصدی، احتمالِ آلوده‌بودن به شرطِ مثبت‌بودن فقط کمی بیشتر از بیست‌وپنج درصد است. مثالی که در کلاس مطرح شد مثالِ دومِ مدخلی از ویکیپدیا است که در پاراگرافِ دومْ نشانی‌اش به شکلِ پیوندِ در متن آمده. بابتِ اشتباه متأسف‌ام، و خوب است حواس‌ام باشد که در ساعتِ چهارِ صبح سعی نکنم مثال‌ام را جالب‌تر کنم.

8 نظر برای "خطایی مشهور در استدلال‌های احتمالاتی [پی‌نوشت دارد]"

  1. جناب لاجوردی، ممنون از اینکه معنای ارزش اخباری را به خوبی و سادگی توضیح دادید. اما نتیجه گیری در پاراگراف آخر درست نیست. مبحث غربالگری، مبحثی بزرگ و پیچیده است و ارزش اخباری تنها یک جز از اطلاعات لازم برای انجام یا عدم انجام آن است. بسته به نوع بیماری و میزان خطر و امکانات و سایر مسایل در مورد تک تک بیماری ها باید تصمیم گرفت که آیا غربالگری کار درستی است یا خیر. ارزش اخباری تنها یکی از اجزای اطلاعات مورد نیاز است و تنها براساس آن حتی اگر نشان دهد که بسیاری از افراد مثبت کاذب یا منفی کاذب نشان داده می شوند نمی توان نتیجه گیری کرد.

  2. با نتیجه گیری/توصیه ی پایانی مطلقن موافق نیستم. با فرض این که هزینه ی آزمایش غربالگری اولیه اندک یا قابل تحمل باشد راه معقول تر آن است فواید و ضررهای احتمالی یک غربالگری گسترده را در نظر بگیریم. در مورد HIV فوایدی نظیر کاهش کلی افراد بیمار در جامعه و امید به ریشه کنی ویروس طی چند نسل و این که هر فرد پیش از آگاهی از بیمار بودنش چند نفر سالم را می تواند "ناخواسته " آلوده کند. افرادی در یک مرحله ازغربالگری مثبت تلقی می شوند در تست های بعدی می شود گاه تا صد در صد در مورد بیمار بودن یا نبود شان نظر داد.

    فرض کن به دنبال شناسایی حاملان شکل معیوب و خطرناک ژن عامل یک بیماری شدید در کودکان در زوج هایی هستیم تصمیم گرفته اند ازدواج کنند و بچه دار شوند(ان شاء الله که "تصمیم" گرفته اند).(احتمالن توضیح بدیهی که بسیاری صفات زیستی معمولن با دو نسخه از ژن منتقل می شود. اگر هر دو نسخه ژن معیوب باشد بیماری رخ می دهد.) اگر پدر مادر آینده هر دو یک نسخه معیوب ژن را داشته باشند کودک شان به احتمال یک چهارم با زجر غیر قابل تحمل درآینده مواجه می شود. فرض کنیم اصلن 75 درصد افرادی که ما مثبت( حامل یک نسخه ی معیوب ژنی) تشخیص داده ایم مثبت کاذب اند. معمولن در پزشکی بعد از تست ارزان اولیه یک تست گران ثانویه هست برای تشخیص دقیق تر.

    هیچ دلیل و گمان منطقی نمی شناسم که بدون آزمایش اولیه بتوانیم تشخیص بدهیم فردی حامل نسخه ی معیوب ژن هست یا نه. حتا اگر تشخیص ما "فقط" 98 درصد قطعیت داشته باشد باز بهتر از توکل است. از یکی جایی باید شروع کرد به محدود کردن گروه در معرض خطر.

    برای "کنار گذاشتن کسی از غربالگری اولیه" و نه برای وارد کردن اش در غربالگری باید دلایل خوبی داشت. شخصن معتقدم حتا کشیش های کاتولیک را هم نباید از غربالگری HIV کنار گذاشت.

  3. توجه به دو نکته شاید مفید باشد.

    ۱. در مثالِ اچ‌آی‌وی/ایدز (که من حتی نسبتِ آلودگان به کلّ جمعیتِ ایالاتِ متحده را از کمتر از یک‌میلیون‌ودویست‌هزار در جمعیتِ بالای سیصدمیلیون تبدیل کردم به دومیلیون در سیصدمیلیون)، احتمالِ آلوده‌بودن به شرطِ مثبت‌بودنِ آزمایش حدودِ ۲۵ درصد است. این یعنی که در حدوداً ۷۵ درصد از مواردِ مثبت، شخصِ آزمایش‌شونده بیمار نیست. با این وصف، واقعاً عاقلانه به‌نظر می‌رسد که، *اگر بنا بر غربالگریِ عام در موردِ اچ‌آی‌وی باشد*، از همان ابتدا برویم سراغِ آزمایشِ ثانویه. و توجه کنیم که نوعاً ایدز موضوعِ غربالگریِ *عام* نیست: همه‌ی جمعیت را در موردِ ایدز آزمایش نمی‌کنند.

    ۲. نگاهی کردم به یک بیماریِ موضوعِ غربالگریِ عام: سرطانِ سینه. مرکزِ ملّیِ سرطان در ایالاتِ متحده اعلام می‌‌کند که بیش از دوازده درصدِ زنانِ متولدِ امریکا دچارِ این سرطان خواهند شد. این عدد بیش از *سه‌هزار* برابرِ درصدِ آلودگان به اچ‌آی‌وی است. عجیب نیست که در این مورد غربالگری می‌‌کنند و در موردِ اچ‌آی‌وی نه.
    https://www.cancer.gov/types/breast/risk-fact-sheet

    با این حال، حرفِ اصلیِ من محاسبه‌ی احتمالِ بیماربودن به شرطِ مثبت‌بودنِ آزمایش بود و نشان‌دادنِ اینکه این احتمال می‌تواند بسیار کم باشد (علی‌رغمِ دقتِ بالای آزمایش)، و وابسته است به اینکه چه کسری از کلّ جمعیت آلوده/بیمار هستند. شاید بهتر بود بندِ آخر را نمی‌نوشتم.

  4. در محاسبه ها دو تا صفر خطا کرده اید.
    0.02 درصد ضرب در 2 میلیون می شود 400 نفر.
    0.02 درصد ضرب در 298 میلیون می شود 59600 نفر.
    با فرضیات شما کل بیمارها می شوند 2059200 نفر.
    احتمال بیماری می شود 97.1%
    البته این چیزی از ارزش مقاله شما در معرفی خطا کم نمی کند…

  5. توضیحِ دوباره با اصلاح و پوزش. نکته‌ی دوم هنوز به نظرم معتبر است. در موردِ اولی هم بخشی از آن را هنوز درست می‌پندارم: *اگر* درصدِ خطا زیاد باشد، آنگاه لابد بهتر است از اول برویم سراغِ آزمایشِ دقیق‌تر.

  6. به نظرم دو تا موضوع هست:
    نخست نفعی که جامعه از غربالگری می برد دربرابر هزینه ای که پرداخت می کند.
    دوم فایده ای که فرد مبتلا می برد از این که مثلن ده سال زودتر از بیماری اش (که هم اکنون احتمالن عوارضی ندارد) باخبر شود. در کنار هزینه ی روانی این که فردی جواب مثبت کاذب دریافت کند جوابی که قابل پیگیری است. هیچ پزشکی با یک جواب مثبت اولیه در مورد بیماری هایی نظیر سرطان یا عفونت های خاص سراغ درمان نمی رود.

    شخصن بار اخلاقی این که به کسی بگویم به خاطر فلان استدلال ریاضی نرو تست فلان بیماری را نده مطلقن بر دوش نخواهم کشید.

پاسخ دهید