مقدار احتمال (p-value)[نکته ۱]در آزمون معناداری فرض صفر، احتمال بدست آوردن نتایج آزمون تحت فرض صفر است (با فرض درست بودن آن)[۲][۳].

هر چه مقدار احتمال کمتر باشد، احتمال رخداد فرض صفر کمتر خواهد بود. معمولا مقدار احتمال 5 درصد برای کارهای تحقیقاتی و 1 درصد برای ابزار دقیق به کار می رود.

اعتبار علمی

ویرایش

گزارش مقدار احتمال آزمون‌های آماری در نشریات دانشگاهی بسیاری از شاخه‌های علمی، امری رایج است. از آنجا که دریافت معنای دقیق مقدار احتمال مشکل است، از آن در حد وسیعی سوء استفاده شده و موضوعی اصلی در فرا-علم، که با کمک روش-شناسی علمی، به مطالعه خود علم می‌پردازد) بوده‌است.[۴][۵]

مفاهیم پایه

ویرایش

در آمار، به هر حدس مرتبط با توزیع احتمالاتی مجهولِ گردایه ای از متغیرهای تصادفی، فرض آماری گفته شده، که متغیرهای مذکور، نماینده داده‌های مشاهده شده X در یک مطالعات تحقیقاتی می‌باشند. اگر ما صرفاً یک فرض را بیان کرده و هدف آزمون آماری هم بررسی درستی آن باشد تا در صورت نادرستی به سراغ فرض‌های دیگری رود، در این صورت به آن آزمون آماری، آزمون معناداری گفته می‌شود. توجه کنید که فرض به خودی خود ممکن است قادر باشد تا توزیع مجهول X را به‌طور دقیق مشخص کند، یا ممکن است تنها چیزی که بگوید این باشد که این توزیع به دسته ای از توزیع‌ها متعلق است. اغلب، ما داده‌ها را به یک آماره عددی T تقلیل می‌دهیم که توزیع احتمالاتی حاشیه ای آن ارتباط نزدیکی با سؤال اصلی مد نظر در مطالعات دارد.

مفهوم ساده

ویرایش

فرض کنیم از یک جامعه نمونه برداری کنیم. مقدار احتمال (مقدار احتمال) می‌گوید که این نمونه چه مقدار نماینده جامعه است؛ مثلاً اگر مقدار احتمال از یک مقدار آستانه کمتر شد، باید پذیرفت که نمونه از توزیع جامعه پیروی نمی‌کند.

مثال‌های ساده کاربردی

ویرایش

مثال۱

ویرایش

فرض کنید در تهران «میانگین» و «انحراف استاندارد» نمرات نهایی درس علوم دانش آموزان پایه پنجم دبستان به ترتیب ۱۶ و ۷ اعلام می‌شود. معلم علوم کلاس پنجم دبستان یکی از مدارس تهران که ۲۱ دانش آموز دارد، با اعلام میانگین و انحراف استاندارد ۱۸ و ۴ پاداش آموزشی درخواست می‌کند. ما را جهت بررسی پرونده می‌گمارند.

فرض پوچ (صفر): این کلاس هم مانند مدارس دیگر است و این نمرات چندان شگفت‌انگیز نیستند.

فرض مقابل: نمرات این کلاس استثنایی هستند؛ زیرا از توزیع آماری جامعه پیروی نمی‌کند.

فرض اولیه: سطح معناداری ۵٪ باشد.

راه حل در متلب

ویرایش

چون شمار دانش آموزان پایه پنجم تهران از سی بیشتر است و میانگین و انحراف معیار موجودند، از آزمون Z استفاده می‌کنیم. ابتدا مقدار دهی اولیه را انجام می‌دهیم:

ns=21;ms=18;sdp=7;mp=16;

که به ترتیب شمار نمونه‌ها، میانگین نمونه‌ها، انحراف معیار جامعه و میانگین جامعه هستند. سپس از کد زیر خطای استاندارد ۱٫۵۲۷۵ و نمره استاندارد ۱٫۳۰۹۳ به‌دست می‌رسند:

SE=sdp/sqrt(ns),Z_Score=(mp-ms)/SE,

توسط مقدار احتمال = normcdf (Z_Score,0,1) مقدار احتمال برابر ۰٫۰۹۵۲ محاسبه می‌شود.

  • چون پی-مقدار (مقدار احتمال) از سطح معناداری بیشتر شده، پس نمی‌توان فرض پوچ (صفر) را مردود دانست.

پیشنهاد به معلم: برای اینکه کلاس جزو مدارس استثنایی علوم تهران قرار گیرند؛ دو پیشنهاد داریم:

  • بالا بردن نمرات دانش آموزان
  • افزایش شمار دانش آموزان کلاس

مثال۲

ویرایش

در یک روزنامه معتبر ادعا شده که ۲۷ درصد ایرانیان زیر خط فقر هستند. یک کنشگر اجتماعی به این موضوع شک می‌کند. او از ۳۰۰ نفر پرس و جو می‌کند و فقط ۳۳ درصدشان را زیر خط فقر می‌یابد. در کد متلب زیر مقدار احتمال محاسبه شده‌است:

aN=300; am=0.33; sm=0.27;

Z=(am-sm)*sqrt(aN)/sqrt(sm*(1-sm)); p_value=1-normcdf(Z); fprintf('P value = %g%s\n',p_value*100,'%')

که ۰٫۹۶٪ حاصل می‌شود. حال این کنشگر می‌تواند معیار یک درصد را لحاظ کند و رسماً اعلام کند که این خبر نادرست بوده‌است. اما اگر او فقط از ۱۴۰ نفر پرس و جو می‌کرد (و همین میانگین و پراکنش موجود بود) مقدار احتمال بیش از ۵ درصد می‌شد، که برای رد حتی یک مجله معمولی هم کفایت نمی‌کرد.

یادداشت‌ها

ویرایش
  1. ایتالیک شدگی، بزرگی و کوچکی حروف و خط فاصله در این عبارت بین منابع مختلف متفاوت است. به عنوان مثال در سبک نوشتاری AMA، از "P value" استفاده شده در حالی که سبک APA به صورت "p value" و انجمن آمار آمریکا آن را به صورت "p-value" می‌نویسد.[۱]

منابع

ویرایش
  1. http://magazine.amstat.org/wp-content/uploads/STATTKadmin/style%5B1%5D.pdf
  2. Aschwanden, Christie (2015-11-24). "Not Even Scientists Can Easily Explain مقدار احتمالs". FiveThirtyEight. Archived from the original on 25 September 2019. Retrieved 11 October 2019.
  3. Wasserstein, Ronald L.; Lazar, Nicole A. (7 March 2016). "The ASA's Statement on مقدار احتمالs: Context, Process, and Purpose". The American Statistician. 70 (2): 129–133. doi:10.1080/00031305.2016.1154108.
  4. Hubbard, Raymond; Lindsay, R. Murray (2008). "Why P Values Are Not a Useful Measure of Evidence in Statistical Significance Testing". Theory & Psychology. 18 (1): 69–88. doi:10.1177/0959354307086923.
  5. Ioannidis, John P. A.; et al. (January 2017). "A manifesto for reproducible science" (PDF). Nature Human Behaviour (به انگلیسی). 1: 0021. doi:10.1038/s41562-016-0021. S2CID 6326747.

برای مطالعهٔ بیشتر

ویرایش

پیوند به بیرون

ویرایش