مقدمه
در حالی که اغلب تعیین توزیع احتمالی برای یک متغیر تصادفی معین مفید است، بسیاری مواقع در استنباط آماری و تصمیمگیری توابع احتمالی متغیرها دارای یک فرم هستند.
در چنین مواردی استفاده از نظریه توابع احتمالی شرح داده شده در فصل پنجم برای به دست آوردن نتایج کلی در مورد توزیع احتمالی مثل میانگین و واریانس بهتر است از به دست آوردن این مشخصهها در هر حالت ویژه.
زیراکسل کننده خواهد بود که در هر مورد جدید با استفاده از توزیع احتمالی یا چگالی، فرایند تعیین مشخصهها مثل میانگین و واریانس را انجام دهیم.
خوشبختانه به اندازه کافی همانندی بین انواع معین از آزمایشهای منحصر به فرد معلوم وجود دارد، به طوری که به دست آوردن یک فرمول که نشان دهنده ویژگی عمومی این آزمایشها باشد را ممکن میسازد.
در این فصل بعضی از توزیعهای احتمالی متغیرهای تصادفی گسسته مثل توزیعه ای دو جملهای، فوق هندسی و پواسن را مطالعه خواهیم نمود و خواص آنها را بررسی میکنیم این توزیعها از مهمترین توزیعهای گسسته در آمار هستند که کاربرد زیادی دارند.
توزیعهای احتمالی متغیرهای پیوسته با تأکید بر توزیع نرمال که کاملاً شناخته شده است و در آمار استفاده زیادی از آن میشود در فصل هفتم بحث خواهد شد.
آزمایش دو جملهای
بسیاری از آزمایشگاه هستند که دارای یک ویژگی عمومی بوده و آن عبارت است از اینکه نتایج آنها به یکی از دو پیشامد دستهبندی میشوند.
برای مثال، «آزمایش دسته بندی یک متقاضی شغل که مرد یا زن است» دارای دو نتیجه میباشد، آزمایش پرتاب یک سکه که نتیجه آن پیشامد شیرآمدن و خط آمدن میباشد.
تولد یک نوزاد که نتیجه آن پسر و یا دختر میباشد.
آزمایش انتخاب یک کالای تولیدی که نتیجه آن تنها به یکی از دو صورت سالم و یا ناقص اتفاق میافتد.
در حقیقت این امکان همیشه وجود دارد که نتایج رخدادهایی که در زندگی روزمره اتفاق میافتد را به صورت دو نتیجه «موفقیت» و یا «عدم موفقیت» شرح دهیم.
امتحانهایی که تنها منتج به دو نتیجه میشوند، نقش بسیار مهمی در یکی از توزیعهای احتمالی گسسته که کاربرد زیادی در عمل دارد یعنی «توزیع دو جملهای» ایفا میکنند.
قبل از این که توزیع دو جملهای را معرفی کنیم، آزمایش دو جملهای را شرح میدهیم با توجه به مثالهای بالا و مثالهایی مثل مصاحبه با یک رأی دهنده که جواب آن موافق کاندیدای مورد نظر است و یا نیست.
پرتاب موشک که نتیجه آن به هدف خوردن و یا به هدف نخوردن است، ملاحظه میشود که صرف نظر از بعضی از تفاوتها همه آنها دارای یک مشخصه ویژه آزمایش دو جملهای میباشند.
تعریف:
یک آزمایش دو جملهای دارای فرضیات زیر است.
1-آزمایش دو جملهای مرکب از n امتحان یکسان ساده است.
2-هر امتحان منتج به یکی از دو نتیجه میشود.
یک نتیجه را موفقیت و با S نشان داده و نتیجه دیگر را عدم موفقیت و با F نشان میدهیم.
3-احتمال موفقیت در یک امتحان ساده مساوی P است، که از یک امتحان به امتحان دیگر ثابت باقی میماند احتمال عدم موفقیت مساوی q=1-P است.
4-امتحانها از هم مستقل میباشند.
5-علاقمند به X، تعداد موفقیتهای هستیم که در nبار آزمایش ساده مشاهده میشود.
امتحانهای سادهای که در این شرایط صدق میکنند به آزمایشهای «برتولی» معروفند.
در عمل فرضهای بیان شده در یک آزمایش دو جملهای تنها در حالتهای محدودی وجود دارند، اما مادامی که هر آزمایش روی آزمایش دیگر اثر ناچیزی داشته باشد میتوان نظریه دو جملهای را بکار برد.
برای مثال، احتمال این که یک رایدهنده موافق کاندیدای معینی در یک انتخاب سیاسی رأی به دهد تقریباً از یک امتحان به امتحان دیگر ثابت میماند.
مادامی که جامعه رای دهندگان در مقایسه با نمونه نسبتاً بزرگ باشد.
اگر پنجاه درصد جامعه 1000 نفری از رای دهندگان کاندیدای A را ترجیح به دهند، آن گاه احتمال موافق بودن اولین مصاحبه شونده به کاندیدای A مساوی خواهد بود.
احتمال موافق بودن دومین مصاحبه شونده به کاندیدای A مساوی یا خواهد بود که بستگی دارد به اینکه آیا اولین مصاحبه شونده موافق بوده یا مخالف آن.
هر دو عدد نزدیک به هستند، در عمل برای سومین، چهارمین و nامین انتخاب هم همین طور است در صورتی که n
برای مثال، احتمال این که یک رایدهنده موافق کاندیدای معینی در یک انتخاب سیاسی رأی به دهد تقریباً از یک امتحان به امتحان دیگر ثابت میماند.
هر دو عدد نزدیک به هستند، در عمل برای سومین، چهارمین و nامین انتخاب هم همین طور است در صورتی که n خیلی بزرگ باشد.
اما اگر تعداد جامعه 10 و تعداد موافق کاندیداA، 5 نفر باشند، آن گاه احتمالی این که اولین رای دهنده موافق A باشد مساوی و دومین مساوی یا بستگی به این که اولی موافق یا مخالف بوده است خواهد بود.
بنابراین برای جوامع کوچک، احتمال موافق بودن از یک رأی دهنده به رأی دهنده دیگر (از یک امتحان به امتحان دیگر) به طور محسوس تغییر میکند و نتیجتاً آزمایش دو جملهای نخواهد بود.
توزیع احتمالی دو جملهای توزیع دو جملهای بوسیله مقادیر n و p که پارامترهای توزیع هستند توصیف میشود.
پارامتر هر توزیع عبارت است از یک مشخصه جامعه.
در توزیع دو جملهای پارامتر n عبارت است «تعداد امتحانها» و p عبارت از احتمال موفقیت در هر امتحان ساده میباشد.
برای هر n وp داده شده با توجه به فرضیات آزمایش دو جملهای میتوان احتمال هر تعداد موفقیت را حساب کرد و نیز میتوان دیگر مشخصههای توزیع مثل میانگین و واریانس را هم به دست آورد.
برای نشان دادن این که چگونه توزیع احتمالی دو جملهای حاصل میشود،فرایند تولید را در نظر بگیرید که یک وسیله همانندی تولید میکند که به دو صورت سالم و یا ناقص دستهبندی میشود.
وقتی که فرایند به طور درست کار نکند، احتمال ثابت 10/0=p وجود دارد که کالا ناقص تولید شود.
تعداد ناقصها هر مقداری از 0 تا تعداد آزمودنی (n) میتواند باشد.
برای مثال، ممکن است سئوال شود، «احتمال این که در یک نمونه تصادفی چهارتایی یک نتیجه ناقص باشد چقدر است؟
یا احتمال این که دو یا بیشتر در یک نمونه تصادفی چهارتایی ناقص وجود داشته باشد چقدر است؟
کلمه تصادفی معادل مستقل بودن در تعریف آزمون دو جملهای است.
برای محاسبه احتمالات در آزمایش دو جملهای میتوانیم از قوانین ضرب احتمال استفاده کنیم.
مانند (یک رویداد) p(تعداد رویدادهای مربوط)=(پیشامد)p در یک مسئله دو جملهای، علاقمند به محاسبه احتمال دقیقاً x موفقیت در n تکرار امتحان برنولی هستیم، که هر امتحان دارای احتمال موفقی p است.
به این معنی که ما x موفقیت و n-x عدم موفقیت داریم.
برای محاسبه چنین احتمالهایی، لازم است که احتمال یک رویداد از این وع را پیدا کنیم، آن گاه آن را در تعداد ممکن چنین رویدادهایی ضرب کنیم.
چون فرقی ندارد کدام رویداد را ابتدا بررسی کنیم، فرضی کنید به طور اختیاری این رویداد را بررسی کنیم که در آن x موفقیت ابتدا رخ دهد، ادامه پیدا کند یا n-x (عدم موفقیت).
فرض کنید موفقیت S= و عدم موفقیت F= باشد، بنابراین این رویداد ویژه به صورت زیر مرتب نمود.
SS…S FF…F n-x عدم موفقیت x موفقیت برای تعیین احتمال توأم چنین دنباله ویژهای از موفقیتها و عدم موفقیتها، توجه کنید که امتحانها فرض میشوند که از هم مستقل هستند.
چون احتمال یک موفقیت p(S)=p و p(F)=q است، بنابراین داریم.
P(SS…S FF…F)=p(S)p(S)…p(S)p(F)p(F)…p(F) =(p)(p)…(P)(q)(q)..(q) میتوان نشان داد که نشان دهنده احتمال هر دنبالهای است که در آن x موفقیت و n-x عدم موفقیت وجود دارد.
بنابراین کافی است بدانیم چند رخ داد متفاوتی وجود دارد که در آن x موفقیت و n-x عدم موفقیت داشته باشیم.
جواب عبارت است از تعداد ترکیبهای x از n میدانیم این تعداد عبارت از بنابراین حاصلضرب در احتمال x موفقیت در n امتحان را با احتمال ثابت موفقیت (p) به صورت زیر به دست میدهد.
(6-1) (x موفقیت در n امتحان)p این توزیع را توزیع دو جملهای گویند.
اگر متغیر تصادفی X دارای توزیع دو جملهای با پارامترهای n و p باشد معمولاً آن را به صورت زیر مینویسند.
مثال 6-1 اگر کسر ناقصی تولید یک کالا مساوی 1/0=p باشد، در یک نمونه تصادفی چهارتایی از این کالاها توزیع احتمالی تعداد کالاهای ناقص را حساب کنید.
حل: یک کالای انتخاب دو صورت خواهد داشت یا سالم است و یا ناقص.
احتمال این که یک کالای انتخاب ناقص باشد مساوی 1/0=p کالاهای انتخابی از همدیگر مستقل هستند بنابراین تعداد کالاهای خراب در نمونه دارای توزیع دو جملهای است.
بنابراین توزیع احتمالی تعداد کالاهای خراب طبق جدول 6-1 خواهد بود.
جدول 6-1: توزیع دو جمله با 4=n و 1/0=p که در آن احتمال این که دقیقاً (1=x) کالای خراب در نمونه چهارتایی (4=n) وقتی که 1/0=p باشد، داشته باشیم به صورت زیر حساب میشود با استفاده از جدول 6-1 به سادگی میتوان احتمال این که تعداد خرابها کمتر یا مساوی 2 باشد را حساب کرد.
مثال 6-2 به منظور عیب یابی در تولید یک نوع کالا که به مقدار زیاد توسط ماشین در کارخانه تولید میشود، با استفاده از طرح نمونهگیری، کالای تولیدی بازرسی میشود.
ده قلم کالا به طور تصادفی انتخاب و مورد آزمایش قرار میگیرند.
چنانچه دو یا بیشتر کالای ناقص مشاهده شود، کالای تولیدی رد میشود.
اگر کل کالای تولیدی دقیقاً 5 درصد ناقص داشته باشد، احتمال این که کالا پذیرفته شود چقدر است؟
احتمال این که کالا رد شود چقدر است؟
حل: با توجه به شرایط یک آزمایش دو جملهای، مشاهده میشود که تعداد کالاهای ناقص در نمونه، x دارای توزیع دو جملهای زیر است.
در صورتی کالا پذیرفته میشود که در نمونه یا خراب مشاهده نشود و یا یکی مشاهده شود بنابراین آن گاه، احتمال رد کالا عبارت خواهد بود از مثال 6-3 یک واکسن جدید جلوگیری از سرماخوردگی برای تعیین اثر جلوگیری آن در سرماخوردگی عمومی مورد آزمایش قرار گرفته است.
برای این کار به ده نفر واکسن تزریق کرده و بعد از مدت یکسال مشاهده شده که هشت نفر زمستان را بدون سرماخوردگی سپری کردهاند.
فرض کنید وقتی که واکسن استفاده نشود، احتمال اینکه یک نفر بدون سرماخوردگی زمستان را سپری کند مساوی 5/0 باشد.
احتمال اینکه هشت نفر یا بیشتر زمستان را بدون سرماخوردگی سپری کنند بشرطی که واکسن در افزایش مقاومت بدن در برابر سرماخوردگی موثر نباشد چقدر است؟
حل: فرض کنید در صورتی که واکسن مؤثر نباشد، احتمال اینکه یک نفر زمستان را بدون سرماخوردگی طی کند مساوی 5/0=p است.
توزیع احتمالی برای x، تعداد سرما نخورهها عبارت است از: مثالهای 6-1، 6-2 و 6-3 موارد استفاده توزیع دو جملهای و محاسبه احتمال x موفقیت در n امتحان را با توجه به تعریف آزمایش دو جملهای روشن میساند.
البته نکته مهم این است که برای هر عمل فیزیکی بایستی دقیقاً مشخصههای آزمایش دو جملهای بخش 6-2 برای تعیین اینکه آیا مدل آزمایش دو جملهای برای عمل مورد نظر معتبر است تطبیق داده شود.
توجه میکنید که مثالهای فوق مسائلی احتمالی بودند تا آماری.
احتمال موفقیت در یک امتحان ساده معلوم است و ما میخواهیم در n امتحان احتمال پیشامدهای عددی معینی را حساب کنیم.
حال روش را بر عکس در نظر میگیریم، به این معنی که فرض میکنیم یک نمونه از جامعه داریم و میخواهیم راجع به p استنباط بکنیم.
شکل فیزیکی مثالهای 6-2 و 6-3 در صورتی که هدف نهایی استنباط آماری باشد وضعیت عملی خوبی به دست میدهد از این دو مسئله در بخشهای آتی در استنباط آماری استفاده خواهیم کرد.
تمرین 6-1 اطلاعات قبلی نشان میدهد که 30درصد تمام بیمارانی که در یک کلینیک پذیرش میشوند نمیتوانند هزینه خود را پرداخت کنند.
فرض کنید 4=n بیمار جدید نشان دهنده یک نمونه جدید از جامعه بیمارانی باشند که توسط کلینیک تحت مداوا قرار میگیرند.
احتمال اینکه الف) هیچکدام از بیماران هزینه را پرداخت نکنند.
ب) یک نفر از بیماران هزینه را پرداخت نکند.
ج) تمام بیماران هزینه را پرداخت کنند.
احتمال اینکه تیراندازی در هر شلیک تیر به هدف بزند مساوی 8/0 است.
او چهار تیر به هدف شلیک میکند، پیدا کنید.
الف) دقیقاً دو تیر به هدف بزند.
ب)لااقل یک تیر به هدف بزند.
ج)چهار تیر به هدف اصابت نماید.
6-3 یک روش جدید جراحی 80درصد با موفقیت انجام میشود.
اگر عمل جراحی پنج مرتبه انجام شود و فرض کنیم که عملاً از یکدیگر مستقل باشند پیدا کنید.
الف) احتمال اینکه هر پنج عمل با موفقیت انجام شوند چقدر است؟
ب) احتمالی اینکه کمتر از دو عمل به موفقیت بیانجامد چقدر است؟
ج) فقط چهار عمل با موفقیت انجام شود چقدر است؟
6-4 به تمرین 6-3 مراجعه نمائید، اگر کمتر از دو عمل با موفقیت همراه بودند در باره تیم عمل جراحی چه نظری داشتید؟
6-5 به تمرین 6-3 مراجعه کنید، اگر x تعداد موفقیتها در عملهای جراحی باشد، توزیع احتمالی آن را رسم نمائید.
6-4-میانگین و واریانس توزیع دو جملهای میدانیم که توزیع دو جملهای بوسیله پارامترهای n و P مشخص میشوند.
از طرفی هر توزیعی دارای مشخصههایی است مثل میانگین و واریانس.
بنابراین ممکن است در توزیع دو جملهای، میانگین و