درمطالعات تجربی، شبه تجربی که درآنهاعملکرد متغیر موردمطالعه درشرایط متفاوت باهم مقایه میشوندطبیعت پرسش درمورد معنی دار بودن تفاوت درمیانگین، پیش میآید.
درچنین شرایطی به ندرت پرسش درموردطبیعت اطلاعات مطرح میشود.
چرا که درمطالعات تجربی واقعی دادهها معمولاً حالت کلی به خود میگیرند.
فرض کنید دریک مطالعه ساده تجربی درمورد یک داردکارایی آن دردوحالت متفاوت (گروه آزمایش و گروه شاهد) اندازه گیری شده است.
میانگینهاممکن استبه طورقابل توجهی با هم تفاوت داشته باشند.
آیا اگر مطالعه مجدداً تکرار شود.
تفاوتهای مشابهی به وقت میآید؟
اینجاست که یک محقق میخواهد معنی دار بودن آماری تفاوت میانگینهابین دو گروه، آزمایش و شاهد را آزمایش کند.
روشهای پارامتری در بیشتر مدلهایی که برای شیوههای استنباطی موردبحث قرارمیگیرد به طورتجربی ساختار معینی را درباره توزیع جامعه فرض میکنند، رفتار آزمونها همه برمبنای این فرضا هستند که اندازههای پاسخ، نمونههایی از جامعههای نرمال تشکیل میدهند.
این شیوهها برای ساختن استنباطهایی درباره مقادیر پارامترهای طرحریزی شده اند که وقتی مجاز به استفاده از منحنی جامعه نرمال هستیم به کار میروند.
به طورکلی، اینها را شیوههای استنباط پارامترهای نظریه نرمال مینامند.
نمونههای مستقل (واریانس نامعلوم) وقتی هدف انجام مقایسه ای بین دوجامعه یا دو گروه است وضعیتی را بررسی میکنیم که درآن دادههابه شکل نمونههای تصادفی به حجم از جامعه 1 و به حجم از جامعه 2 تحقق یافتهاند.
از جامعه 1 از جامعه 2 فرضهای کوچک نمونه ای 1) نمونه ای تصادفی از است.
2) نمونهن ای تصادفی از است.
3) مستقل اند.
فرض آزمون: آماره آزمون: فرض مقابل: ناحیه رد در سطح معنی داری : برمنظورمقایسه دربرنامه جهت آموزش کارگران صنعتی برای انجام کاری تخصصی 20کارگردرآزمایش شرکت داده میشوند.
از بین آنهابه طورتصادفی 10نفر را برای آموزش به وسیله روش 1و10نفر بقیه را با روش 2 آموزش میدهند.
بعدازتکمیل دوره آموزش همه کارگران درمعرض یک آزمون زمان و حرکت قرارمیگیرند که سرعت انجام یک کارتخصصی را ثبت میکند.
دادههای زیر به دست آمده اند فرض برابری دو برنامه آموزشی در برابر فرض رو میشود میتوان نتیجه گرفت که آموزش به وسیله روش دوم بهتر ازروش اول میباشد.
وقتی که هردوحجم نمونه ای بزرگتر از25 یا 30 باشند لازم نیست که فرض کنیم توزیع جامعههای مادر، نرمال هستند زیرا قضیه حدمرکزی تضمین میدهد که تقریباً به صورت تقریباً به صورت توزیع شدهاند.
شیوه تصادفی کردن برای مقایسه در گروه از واحد آزمایش موجود واحد را برای دریافت گروه 1 به طورتصادفی برگزینید و بقیه واحد را به گروه 2 نسبت دهید انتخاف تصادفی موجب میشود که تمام گزینش ممکن برای انتخاب شدن همشانس باشند.
در روش آزمایش فرضیههای عنوان شده نتوان فرض کرد که واریانسهای دو جامعه برابرند آنگاه روش آزمون فوق باید اصلاح گردد.
در این صورت آماره آزمون به صورت زیر خواهد بود.
و درجه آزادی برای t برابرخواهد بود با: نمونههای مستقل با واریانس معلوم دوجامعه با میانگین های نا معلوم و واریانس های معلوم را درنظر گیرید.
فرض آزمون: آماره آزمون: فرض مقابل: ناحیه رد درسطح معنی داری : نمونههای وابسته: درمقایسه دو عامل مطلوب آن است که واحدهای آزمایش تا جایی که ممکن است همگن باشند، به طوری که اختلاف در پاسخهای بین دو گروه را بتوان به اختلافهای دو عامل نسبت داد.
اگر بعضی شرایط قابل شناسایی که میتوانند در پاسخ اثر کنند به طریقی کنترل نشده، مجاز به تغییر روی واحدها باشند آنگاه تغییرپذیری زیادی در اندازهها به وجود میآید.
دراین حالت اغلب مبنایی برای جفت کردن ارقام در دو نمونه وجود دارد.
از طرف دیگر شرط همگنی ممکن است روی تعداد آزمودنیهای موجود در یک آزمایش مقایسهای محدودیتی جدی را تحمیل کند.
برای فراهم کردن سازش بین دو ضرورت مغایر همگن و تنوع واحدهای آزمایش مفهوم جورکردن یا بلوکبندی موضوعی بنیادی است.
این شیوهن شامل انتخاب واحدها در گروهها یا بلوکهاست به طوری که واحدهای هربلوک همگن بوده و واحدهای بلوکهای مختلف متفاوت باشند.
این روش کارایی مقایسهای درون هربلوک را حفظ میکند و متفاوت بودن شرایط در بلوکهای مختلف را نیز اجازه میدهد.
این طرح نمونهگیری به وسیله زوجهای جور شده یا مقایسه زوجی درمقایسه دو عامل مطلوب آن است که واحدهای آزمایش تا جایی که ممکن است همگن باشند، به طوری که اختلاف در پاسخهای بین دو گروه را بتوان به اختلافهای دو عامل نسبت داد.
این طرح نمونهگیری به وسیله زوجهای جور شده یا مقایسه زوجی نامیده میشود.
مقایسه زوجی: واحدهای آزمایش زوج 1 2 1 واحدها در هر زوج شبیه هستند 2 1 2 واحدهای زوجهای مختلف ممکن است بیشباهت باشند 1 2 n ساختار دادهها برای یک مقایسه زوجی تقاضل تیمار2 تیمار1 زوج 1 2 n زوجهای مستقل هستند.
، چون تفاضلهای از اثرهای بلوکی آزاد شدهاند معقول است که فرض کنیم آنها تشکیل نمونهای تصادفی از جامعهای با میانگین و واریانس را میدهند.
آزمون مبتنی برآماره آزمون زیر است.
, مثال: ادعا شده است که یک برنامه ایمنی صنعتی که کاهش تضییع ساعات کار ناشی از نقص در ماشینهای کارخانه موثر است.
دادههای زیر مربوط به ضایع شدن ساعتهای کار هفتگی به واسطه نقض در 6دستگاه است که قبل و دیگری بعد از اجرای برنامه ایمنی جمعآوری شدهاند.
دستگاه d=(x-y) باتوجه به اینکه فرض صفر رد نمیشود بنابراین میتوان نتیجه گرفت که برنامه ایمنی صنعتی در کاهش تضییع ساعات کار ناشی از نقص در ماشینهای کارخانه بیتأثیر است.
روشهای ناپارامتری آمار ناپارامتری بخش اساسی از شیوه های استنباطی است که تحت دامنه وسیعتری از شکلهای توزیع جامعه معتبر است.
اصطلاح استنباطی ناپارامتری از این واقعیت نتیجه میشود که کاربرد این شیوهها به مدلبندی جامعه برحسب یک شکل پارامتری معین منحنیهای چگالی، مثل توزیعهای نرمال، نیازی ندارد.
در آزمون فرضها آمارههای آزمون ناپارامتری نوعاً بعضی جنبه های ساده دادههای نمونه را موارد استفاده قرارمیدهند مثل علامتهای اندازهها، رابطههای ترتیب، یا فراوانیهای دستهای، این طرحهای کلی، وجود یک مقیاس عددی معنیدار را برای اندازهها لازم ندارد.
به طور مستمر بزرگ یا کوچک بودن مقیاس در آنها تغییری نمیدهد.
نمونههای مستقل: برای مطالعه مقایسه دو تیمار B , A مجموعه ای از واحد آزمایشی به طور تصادفی به دو گروه بترتیب با حجمهای تقسیم میشوند.
تیمار A در و تیمار B در واحد به کار میرود.
اندازههای پاسخ، که مختصری متفاوت با نمادگذاری قبل نوشته میشوند عبارتاند از: تیمار A تیمار B این دو گروه تشکیل نمونههای تصادفی مستقل از دوجامعه را میدهند.
با فرض اینکه پاسخهای بزرگتر نمایشگر یک تیمار بهترند مایلیم این فرض صفر را که بین دو اثر تیمار اختلافی وجود ندارد در برابر فرض مقابل یک طرفهای که تیمار A موثرتر از تیمار B است آزمون کنیم.
مدل: هر دو توزیع پیوستهاند.
فرضها: : توزیعهای درجامعه یکساناند.
: توزیع جامعه A به سمت راست توزیع جامعه B انتقال یافته است.
آزمون مجموع رتبهای و شکل و یلکاکسن فرض کنید بترتیب نمونههای تصادفی مستقل از جامعههای پیوسته A و B باشند، برای آزمون : جامعهها یکی هستند.
1) مشاهده نمونه ترکیبی را به ترتیب افزایش مقدار رتبهبندی کنید.
2) برای نمونه اول مجموع رتبهای را پیدا کنید.
3) الف: برای : جامعه A به سمت راست جامعه B انتقال یافته است؛ ناحیه رد را در دنباله بالایی قراردهید.
ب: برای : جامعه A به سمت چپ جامعه B انتقال یافته است؛ ناحیه رد را در دنباله پایین قراردهید.
ج: برای : جامعهها مختلفاند؛ ناحیه رد را در هردو دنباله با احتمالهای برابر قراردهید.
آماره آزمون مجموع رتبهای و یلکاکسن = مجتمع رتبههای نمونه کوچکتر در رتبهبندی نمونه ترکیبی وقتی که حجمهای نمونهای برابرند، مجموع رتبههای یکی از نمونهها را بگیرید.
جدول ……… ضمائیم احتمالهای دنباله بالایی و هم چنین دنباله پایینی را میدهد.
احتمال دنباله بالایی: احتمال دنباله پایینی: اگر بیان کنید که جامعه متناظر با : الف) به سمت راست جامعه دیگر انتقال یافته است؛ ناحیه رد را به صورت اختیار کنید و C را به عنوان کوچکترین مقدار x بگیرید که برای آن ب) به سمت چپ یا به سمت راست جامعه دیگر انتقال یافته است؛ ناحیه رد را به صورت بگیرید و را از ستون x* و C2 را از ستون x به دست آورید به طوری که مثال: دو لایه از زمین ازنظر فنی بودن محتوای موادمعدنی آنها مقایسه میشوند.
محتوای موادمعدنی هفت نمونه سنگ معدن جمعآوری شده از لایه 1 و پنج نمونه جمعآوری شده از لایه 2 به وسیله تجزیه و تحلیل شیمیایی اندازهگیری شدهاند داده زیر به دست آمدهاند.
آیا محتوای مودمعدنی لایه 1 بیشتر از لایه 2 است؟
مقدار مشاهده شده آماره مجموع رتبهای عبارت است از: با استخراج از جدول …..
وقتی حجم نمونه کوچکتر مساوی 5 و حجم نمونه بزرگتر مساوی 7 است به دست میآوریم.
(فرض مقابل جامعه دوم متناظر با در سمت چپ جامع اول قراردارد).
و بنابراین ناحیه رد با به صورت بنا میشود.
چون مقدار مشاهده شده در این ناحیه قرارمیگیرد فرض صفر در سطح رد میشود.
یعنی محتوای معدنی لایه 1 بیشتر از لایه 2 است.
تقریب بزرگ نمونهای: وقتی که حجمهای نمونهای بزرگ باشند توزیع صفر آماره مجموع رتبهای تقریباً نرمال است و بنابراین آزمون را میتوان با استفاده از جدول نرمال اجرا کرد.
تحت میانگین واریانس تقریب بزرگ نمونهای برای آماره مجموع رتبهای و یلکاسن: وقتی درست است توزیع تقریبا N(0,1) است.
نمونههای وابسته: مقایسههای خروجی ساختار دادههای نمونهگیری زوجی آزمون رتبه علامتدار و یلکاکسن در آزمون رتبه علامت دارد تفاضلهای زوجی برطبق مقادیر عددیشان بدون توجه به علامته مرتب میشوند و سپس برای تشکیل آماره آزمون، رتبههای مربوط به مشاهدات مثبت جمع میشوند.
مراحل آزمون رتبه علامتدار: الف) تفاضلهای ، را محاسبه کنید.
ب) با مرتب کردن مقادیر مطالق ها به ترتیب افزایش، رتبهها را به آنها نسبت دهید، همچنین علامتهای متناظر را ثبت کنید.
ج) آماره رتبه علامتدار ، مجموع رتبههای تفاضلهای مثبت ، را محاسبه نمایید.
د) برحسب اینکه تیمار A ، تحت فرصض مقابل، بیان میکند که دارای پاسخ بالاتر، یا پائینتر ویا متفاوت از تیمار B است ناحیه رد را در دنباله بالایی یا پایینی و یا در هردو دنباله قراردهید.
مثال: برای مقایسه یک شمع جدید ماشین درمقابل یک شمع معمولی به وسیله اندازهگیری مسافت طی شده برحسب کیلومتر یک نمونه متشکل از 12 ماشین، از ماشینهای کوچک گرفته تا ماشینهای بزرگ در این مطالعه آمدهاند مسافت طی شده با مقدار معینی از بنزین برای هرماشین، یک بار با شمع معمولی و بار دیگر با شمع جدید، ثبت میشوند نتایج درجدول زیر داده شدهاند.
ما مرتب کردن این تفاضلها بر ترتیب افزایش مقادیر مطلقشان به آنها رتبهها را نسبت میدهیم و علامتهای متناظر را ثبت میکنی، آماره رتبه علامتدار به صورت زیر محاسبه میشود: مجموع رتبههای مربوطه به تفاضلهای مثبت احتمالهای دنباله انتخاب شده توزیع صفر در جدول …… برای 3=n تا 15=n داده شدهاند.
دراین جدول مقدار مشاهده شده را برابر با 62 (برای 12=n) به دست میآوریم بنابراین فرض صفر در سطح معنیدار بودن رد میشود که برافزایش معنیداری درطول مسافت برحسب کیلومتر با استفاده از نوع جدید شمع دلالت دارد.
درمحاسبه آماره رتبه علامتدار، هم رتبهها به دو طریق ممکن است رخ دهند.
بعضی از تفاضلهای Di ممکن است صفر باشند یا بعضی از تفاضلهای غیرصفر Di ممکن است دارای قدرمطلق برابر باشند.
نوع اول همرتبه را با حذف مقادیر صفر و اصلاح همزمان حجم نمونه با تقلیل آن به مقدار تعداد صفر n=n- رفع و رجوع میکند.
نوع دوم همرتبه را به نسبت دادن رتبه متوسط به هرمشاهده دریک گروه مشاهدات همرتبه با تفاضلهای غیرصفر Di درمحاسبات وارد میکنند.
تقریب بزرگ نمونهای برای آماره رتبه علامتدار: با افزایش حجم نمونهای n تحت فرض صفر، متغیر تقریباً دارای توزیع نرمال با میانگین صفر و واریانس 1 میباشد.
درمواقع وجود همرتبه تعداد عناصر در j امین گروه همرتبه= qI تعداد گروههای همرتبه= Ls آزمونهای تک نمونهای فرض کنید x یک متغایر تصادفی با میانگین و واریانس نامعلوم دراین صورت برای تعیین میتوان از استفاده کرد.
آماره آزمون: فرض مقابل: مقایسه واریانسها: حال به بررسی آزمون فرضیه در مورد واریانس توزیع نرمال میپردازیم.
فرض کنید میخواهیم ببینیم که آیا واریانس یک توزیع نرمال برابر با مقدار ثابتی نظیر است یا خیر در این صورت فرضیههای موردنیاز عبارتند از: آماره آزمون برای این فرضیه به صورت زیر است.
اگر و یا باشد فرضیه خنثی رد میشود.
مقادیر مربعکای از جدول توزیت مربعکای با درجه آزادی تعیین میشوند.
حال آزمون تساوی واریانسهای دوجامعه نرمال را درنظر گیرید.
اگر نمونههای تصادفی به ترتیب از جامعههای 1و2 انتخاب شوند آنگاه آماره آزمون برای فرضیه زیر: نسبت واریانسهای دو نمونه خواهد بود.
اگر یا از جدول توزیع به ازای درجه آزادیهای تعیین میگردد.
مقایسه دو نسبت دوجملهای: اکنون به استنباطهای آماری مربوط به مقایسه بین نرخهای وقوع یک مشخصه در دو جامعه میپردازیم.
نسبت نامعلوم عناصری که مشخصه مخصوصی را در جامعه 1 و جامعه 2 دارند به ترتیب به وسیله نشان میدهیم.
نمونهای تصادفی به حجم از جامعه 1 میگیریم و تعداد موفقیها را به وسیله X نشان میدهیم.
نمونهای تصادفی مستقل به حجم از جامعه 2 انتخاب میکنیم و تعداد موفقیتها را به وسیله نشان میدهیم.
پارامتر: (نسبت در جامعه 2) – (نسبت در جامعه 1)= نسبتهای نمونه: و برای آزمون فرض صفر نسبت نامعین