سامانه ثبت پایان نامه و طرح تحقیقاتی : مستندات کاربری

آنالیز آمـاری

آمار عبارتست از مجموعه ای از فنون یا روشهای ریاضی برای جمع آوری، تنظیم، تجزیه، تحلیل و تفسیر داده های عددی هست. در واقع آمار ابزار اساسی اندازه گیری و ارزشیابی تحقیق است.

آمار معمولا به دو قسمت آمار توصیفی و آمار استنباطی تقسیم میشود. آمار توصیفی برای توصیف و ترکیب داده های استخراج شده از یک نمونه می پردازد. آمار توصیفی یکسری شاخصهای مختص خود مثل میانه، میانگین و..... را دارد که اگر این شاخصها از جامعه گرفته شده باشند پارامتر نامیده میشوند در حالیکه اگر از نمونه گرفته شده باشند معمولا آماره خوانده میشوند.

آمار استنباطی، روشهای آماری برای برآورد پارامترهای جامعه از روی شاخصهای نمونه است. به عبارت دیگر هنگامیکه محقق بخواهد یافته های حاصل از نمونه را به جامعه بزرگتری تعمیم دهد از آمار استنباطی کمک میگیرد.

 انتخاب روش آماری مناسب برای تحلیل داده ها با توجه به هدف پژوهش و روش پژوهش انجام میگیرد.

1- توصيفي:

 آمار توصیفی چهار قسمت است:

  • طبقه بندی اعداد شامل: جداول، نمودارها
  • شاخصهای گرايش مرکزي شامل: میانگین، میانه، مد
  • شاخصهای پراکندگی شامل: دامنه تغییرات، قدر مطلق انحرافات، واریانس، انحراف معیار، ضریب تغییرات
  • آمار توصیفی دو متغیری(همبستگی) شامل: ضریب همبستگی پیرسون، ضریب همبستگی رتبه ای اسپیرمن، آزمون کای دو(مجذور خی2)

بطور خلاصه در آمار توصیفی، محقق ابتدا داده های جمع آوری شده را با تهیه و تنظیم جدول توزیع فراوانی خلاصه میکند و سپس به کمک نمودارها آنها را نمایش میدهد و سرانجام با استفاده از سایر شاخصهای آمار توصیفی آنها را خلاصه میکند.

جداول: به طور کلی از دو نوع جدول برای ارائه نتایج استفاده میشود: جدول ساده و جدول متقاطع.

 جدول ساده جدول یک بعدی است که در آن اطلاعات توصیفی یک متغیر بیان میشود. مثال: توزیع فراوانی مطلق(خام) و نسبی(درصد) واحدهای مورد پژوهش بر حسب وضعیت تاهل.

در جدول متقاطع دو یا چند متغیر و رابطه بین آنها بطور همزمان و یکجا نشان داده میشود. مثال: توزیع فراوانی مطلق(خام) و نسبی(درصد) نوع رفتار واحدهای مورد پژوهش قبل و بعد از آموزش.

نمودار: نمودارها در مقایسه با جداول توزیع فراوانی، تصویر روشن تری از اطلاعات گردآوری شده بدست میدهد. اصولا انواع نمودارها بر حسب نوع متغیرها رسم میشوند. برای متغیرهای کیفی از نمودارهای ستونی و دایره ای استفاده میشود با این تفاوت که به وسیله نمودار ستونی میتوان بیشتر از یک متغیر را نشان داد اما در یک نمودار دایره ای فقط یک متغیر قابل نمایش میباشد. برای متغیرهای کمی نیز از هیستوگرام و نمودار خطی استفاده میشود. برای نمایش دو متغیر کمی و یا یک متغیر کمی با یک متغیر کیفی رتبه ای و یا دو متغیر کیفی رتبه ای از نمودار پراکنش (scatter diagram) استفاده میشود.

اندازه هاي گرايش مرکزي و پراکندگي: اغلب اوقات دسته‌بندي يک سلسله مشاهدات بگونه‌اي صرفه جويانه و معنادار براي کار پژوهشي سودمند است. بدان معنا که يک يا دو آماره بعنوان توصيفي کوتاه از کل داده‌ها عمل مي‌کنند که ما را قادر مي‌سازند تا ويژگيهاي اساسي را درک کنيم يا داده‌ها را بشناسيم. اندازه‌هاي گرايش به مرکز و پراکندگي مي‌توانند ما را به اين هدف برسانند.

 شاخصهای مرکزی شاخصهایی هستند که با استفاده از آنها مجموعه ای از اطلاعات در یک اندازه یا عدد که نماینده آن مجموعه است، خلاصه میشود:

ميانگين: یا معدل تصويري کلي از داده‌ها را بدست مي‌دهد، بدون اينکه ضرورت داشته باشد هر يک از مشاهده‌هاي موجود در يک مجموعه داده‌ها را نشان دهد. برای محاسبه آن کافی است که تمام مقادیر یا داده ها را با هم جمع کرده و بر کل تعداد تقسیم کنیم.

ميانه: گاهي ممکن است علاقمند باشيم که بدانيم در مقايسه با ديگران در کجا قرار داريم ،آيادر نقطه وسط، در 10 يا 25 درصد اول و... قرار داريم. موقعيت ما نسبت به ديگران توسط اندازه مرکزي ميانه و پراکندگي معين مي‌شود. میانه نقطه وسط مشاهدات است یعنی 50% از مشاهدات بالاتر و 50% پایینتر از آن قرار دارد. به کمک ميانه بعنوان يک گرايش مرکزي، صدکها، دهکها و چارکها معنا پيدا مي‌کنند.

نما (مد): پديدهاي که بيشترين فراواني و تکرار را در بين مشاهدات دارد. مثال: در مجموعه اعداد زیر عدد3 بیش از همه اعداد تکرار شده استو نما عدد3 است: 2،3،3،4،3،5،6،6،7

شاخصهای مرکزی به تنهایی قادر به تعیین کلیه ویژگیهای یک توزیع نیستند و چنانچه با اطلاعات حاصل از شاخصهای پراکندگی تلفیق کنیم درک بیشتری از ویژگیهای توزیع، کسب خواهیم کرد:

دامنه: تحت تأثير دو اندازه اول و آخر قرار دارد. يعني تفاضل کوچکترين و بزرگترين اندازه در مجموعه را نشان میدهد.

واريانس: واریانس به منظور محاسبه میزان تغییرات یا پراکندگی داده های توزیع بکار میرود. از مجموع مجذور هر يک از مشاهدات منهاي ميانگين داده‌ها تقسيم بر کل مشاهدات بدست مي‌آيد. هرچه واریانس بزرگتر باشد پراکندگی بیشتر است.

واریانس پراکندگی داده ها را مشخص میکند و به تنهایی تعریف کاربردی مشخصی ندارد ولی برای محاسبه انحراف معیار، محاسبه آن ضرورت دارد. برای محاسبه انحراف معیار ابتدا متوسط مجذور انحرافات از میانگین را تعیین کرده که به آن واریانس میگویند سپس جذر واریانس، انحراف معیار خواهد بود.

ضریب تغییرات: برای مقایسه پراکندگی یک صفت که با دو مقیاس مختلف اندازه گیری شده است یا برای مقایسه پراکندگی دو صفت مختلف از ضریب تغییرات استفاده میشود که عبارتست از نسبت انحراف معیار به میانگین. ضریب تغییرات با درصد بیان میشود.

فراواني: به تعداد دفعاتي که مقوله هاي فرعي يک پديده رخ مي‌دهد، اشاره دارد که ازمحل آن، درصد و درصد تجمعي را مي‌توان محاسبه کرد.

علاوه بر شاخصهای ذکر شده در بالا، دو شاخص مهم دیگر که در تحقیقات تحلیلی کاربرد دارند عبارتست از:

  • خطر نسبی(Relative Risk): عبارتست از بروز پیامد یا بیماری در افراد گروه مواجهه، تقسیم بر بروز پیامد یا بیماری در افراد گروه شاهد(بدون مواجهه). خطر نسبی در مطالعات کوهورت استفاده میشود.
  • نسبت شانس یا نسبت برتری(Odd,s Ratio): با توجه به اینکه در مطالعات مورد-شاهدی نسبتی از جمعیت که نشان دهنده شاهدها و موردهاست، مشخص نیست پس نمیتوان میزان بروز را تعیین کرد. در این مطالعات از نسبت شانس استفاده میشود. به عبارت دیگر شانس بیمار برای تماس با عوامل خطر به شانس فرد شاهد برای تماس با عامل خطر را نسبت شانس می گویند.

استنباطي

در آمار توصیفی، داده های حاصل از اندازه گیری نمونه ها مورد تجزیه و تحلیل قرار میگیرد ولی هنگامیکه محقق بخواهد با استفاده از داده در مورد جامعه قضاوت کند از آمار استنباطی استفاده مینماید.

آزمونهای آمار استنباطی به دو دسته پارامتری و غیرپارامتری تقسیم میشود:

الف: آمار پارامتريک : آزمونهای پارامتری، روشهایی هستند که با آزمون یک یا چند پارامتر جامعه سروکار دارند بعلاوه در مورد متغیرهایی که در مقیاس فاصله ای و نسبتی اندازه گیری شده باشند، انجام میشود. روشهای پارامتری دارای پیش فرضهایی درباره جمعیت تحت مطالعه است از جمله اینکه متغیرهای مورد بررسی دارای توزیع نرمال هستند، پس:

جامعه‌اي که گروه نمونه از آن اخذ شده، نرمال مي‌باشد(در صورتیکه تعداد داده ها بیش از 30 باشد معمولا توزیع داده ها بسمت نرمال پیش میرود):

  • فقط برای داده های عددی (Numeric)
  • براساس اختلاف میانگین ها
  • نیاز به روش های ریاضی مثل جمع و ضرب و تقسیم دارد که در تمام این موارد بایستی از آزمونهای پارامتریک استفاده کرد.

ب: آمار ناپارامتريک: آزمونهای غیرپارامتری برای آزمون فرضیه هایی که درباره پارامترهای جامعه نیست بکار میرود و همچنین برای متغیرهایی که در مقیاس اسمی و رتبه ای اندازه گیری شده اند مورد استفاده قرار میگیرد. پس جامعه ای که

فرض روشني مبني بر نرمال بودن جامعه وجود ندارد:

  • مقیاسهای رتبه ای، ترتیبی و طبقه ای
  • بر اساس اختلاف میانه ها
  • فقط نیاز به شمارش دارد که در اینصورت از آزمونهای غیر پارامتریک استفاده میشود.

در آمار توصیفی مي بايست آزمون مناسب انتخاب شود:

همبستگي : Chi-Square Test و Pearson Test ،Spearman Test :

پيش بینی : Regression Test :

مقایسه، تشخیص تفاوت و رابطه علّي: F Test ،T Test

آزمون های پارامتریک:

1-آزمون Z تک نمونه ای(One-sample z-test): اگر انحراف معیار جامعه در دست باشد، از این آزمون برای مقایسه میانگین یک گروه نمونه با میانگین جامعه استفاده میشود.

 2-آزمون t تک نمونه ای(One-sample t-test): ساده ترین نوع تی تست است. از این آزمون زمانی استفاده میشود که میانگین یک نمونه را با میانگین ثابتی مقایسه کنیم. این میانگین ثابت ممکن است مربوط به میانگین همان متغیر در کل جمعیت باشد یا هر میانگین ثابتی که بخواهیم میانگین نمونه را با آن مقایسه کنیم. شرط استفاده از این تست اینست که نمونه بطور تصادفی از جامعه انتخاب شوند. این آزمون به این سوال پاسخ میدهد که میانگین مشاهده شده در مقایسه با مقدار واقعی تفاوت معنی داری دارد یا خیر.

3-آزمون t-student : . بر خلاف z تست و t تست که فقط یک گروه نمونه وجود دارد که با جامعه مقایسه میشود، در استیودنت تی تست دو گروه مستقل وجود دارد که برای بررسی تفاوت بین میانگین های دو گروه مستقل از آزمون استیودنت تی تست استفاده میشود.

4-آزمون t برای مقایسه میانگین داده ها در دو گروه غیر وابسته(Independent sample t-test) یا (Unpaired t-test): این آزمون برای بررسی تفاوت بین میانگین های دو جامعه آماری مستقل بکار میرود. در واقع هنگامی به کار می رود که بخواهیم معنی دار بودن تفاوت میانگین یک صفت را در دو نمونۀ تصادفی از دو جامعۀ مستقل مورد بررسی قرار دهیم. برای نمونه به منظور بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس جنسیت در خصوص هر یک از فرضیه های پژوهش استفاده میشود.

5-آزمون t  زوجی(paired sample t-test) یا (آازمون قبل و بعد): برا ی مقایسه دو گروه یا تشخیص تفاوت میانگین دو گروه داده وابسته بکار میرود. به این صورت که افراد یا آزمودنی ها در پیش آزمون و پس آزمون شرکت میکنند و یا افراد در دو شرایط آزمایشی متفاوت قرار میگیرند. در واقع میخواهیم بدانيم در يک متغير خاص چه تفاوتي بين گروههاي مورد مطالعه وجود دارد.يعني متغير اسمي را به دو زير گروه تقسيم مي کنيم(سيگاري و غير سيگاري ...) و مورد آزمون قرار مي دهيم تا ببينيم آيا تفاوت معني داری بين میانگین متغيرهاي وابسته وجود دارد يا خیر. 

6-آزمون تحلیل واریانس یک طرفه(One-Way ANOVA): مقدار واریانس نشان دهنده پراکندگی داده ها از میانگین است. هر چه واريانس بزرگتر باشد، انحراف اعداد از ميانگين بيشتر است و هر چه كوچكتر باشد، انحراف اعداد از ميانگين كمتر است. این آزمون تفاوتهاي میانگین دو یا چند گروه را نشان میدهد. مثال: «آياتفاوت معنادار ميان ميزان فروش توسط چهار گروه از فروشندگان وجود دارد». در اينجا بجاي اينکه امتحان مقايسه را دو به دو انجام دهيم، به صرفه تر است که بطور همزمان ميانگين ها را با هم مقايسه کنيم،که از تحليل واريانس بهره مي بريم. در کل روش آماري كه طي آن تاثير يك متغير مستقل روي متغير وابسته بررسي مي‌شود، تحليل واريانس يك طرفه گفته مي‌شود.

تفاوت تحليل واريانس با آزمون t دراين است كه آزمون t براي مقايسه دو ميانگين كاربرد دارد. اگر هدف تحقيق مقايسه چند ميانگين باشد، تحليل واريانس كاربرددارد.

7-آزمونهای متداول پس از تجزیه(Post-Hoc): پس از انجام تحلیل واریانس، چنانچه فرضیه صفررد شود به این معناست که بین میانگین ها تفاوت معنی داری وجود دارد، اما معلوم نیست که این تفاوت در کجاست. جهت مشخص کردن این تفاوت از آزمونهای پس از تجزیه مثل فیشر(Fisher)، توکی(Tukey) یا HSD ، شفه(Scheffe) و دانت (Dunnet)استفاده میشود.

آزمونها ی غیر پارامتریک:

1-آزمون مجذور کای یا خی 2(chi-square): از اين توزيع در آزمون فرضيه هايي که داده‌ها بصورت فراواني یا درصد ارائه شده‌اند مي‌توان استفاده کرد. ممکن است بخواهيم رابطه بين دو متغير اسمي يا مستقل بودن آنها از يکديگر را بدانيم. مثلاً آيا ديدن تبليغات يک کالا با خريد آن توسط افراد رابطه دارد؟...آزمون کاي-دو اختلاف بین فراوانی مشاهد شده و فراواني مورد انتظار را نشان میدهد.

هنگامي‌كه داده‌هايي با مقياس اسمي‌وجود دارد، يكي از معمول ترين آزمونها، آزمون کای دو مي‌باشد. كاربرد آزمون X2 اين است كه مشخص مي‌كند آيا رابطه بين دو متغير كيفي تصادفي است يا واقعي.

2-آزمون مک نمار(Mcnemar): جهت مقایسه دو متغیر اسمی مستقل بکار میرود. آزمون مك نمار، براي معني دار بودن تغييرات به ويژه براي طرح هاي «قبل از/ بعد از» استفاده مي شود كه در آن هر فرد يا آزمودني به عنوان گواه خود به كار مي رود و در آن يافته ها به صورت اسمي يا رتبه اي هستند. از اين آزمون براي بررسي ميزان تاثير يك «مقاله، كتاب، سخنراني، دوره آموزشي، ملاقات هاي فردي و…» استفاده مي شود. مانند هنگامي كه مي خواهيد نظر افراد را قبل از جلسه و بعد از يك جلسه سخنراني مقايسه كنيد، چنين آزمايش هايي نمونه هاي وابسته از داده هاي اسمي يا ترتيبي را در اختيار مي گذارند.

3-آزمون من ویتنی(mann-whitney): معادل آزمون تی مستقل در مقیاس فاصله ای- نسبتی و کای اسکوئر در مقیاس اسمی میباشد. آزمون من–ويتنی يك آزمون مقايسه اي براي مقايسه وضعيت دو گروه مستقل است و وقتي داده هاي يك مطالعه به صورت كيفي ترتيبی باشند بهتر است از اين آزمون كه يك آزمون غير پارامتري است، استفاده كرد. در اين حال از آزمون t دو نمونه مستقل استفاده نمي كنيم زيرا ميانگين متغيري كه در مقياس ترتيبي اندازه گيري شده باشد، به علت يكسان نبودن فاصله واحدها، معني و مفهوم واقعي ميانگين را نخواهد داشت.

كاربرد اين آزمون هنگامي‌است كه قرار است دو گروه را بر حسب رتبه افراد با هم مقايسه كنند. فرض كنيد محققي مي‌خواهد در يك جامعه، تحصيلات را بر حسب جنسيت مورد بررسي و مقايسه قرار دهد، استفاده از آزمون من ـ ويتني در صورتي كه متغير تحصيلات داراي مقولات زياد باشد، امكان پذير مي‌باشد.

4-آزمون فریدمن(Fridman): زمانی که محقق قصد آنرا داشته باشد که یک متغیر رتبه ای را بیش از دو زمان مورد مقایسه قرار دهدیا اختلاف بین زمانهای مختلف را بسنجد، استفاده میگردد. به عنوان مثال محقق شدت درد پس از عمل را بصورت خفیف، متوسط و شدید در سه زمان متفاوت مقایسه میکند.

هنگامي‌ كه قرار است متغيرهايي با مقياس رتبه‌اي در k گروه وابسته آزمون شوند، جهت بررسي تفاوت در گروه هاي وابسته از اين آزمون استفاده مي‌شود.

5-آزمون ویلکاکسون(قبل و بعد ناپارامتری رتبه ای) (Wilcoxone) : محقق به مقایسه دو میانگین رتبه ای در یک متغیر وابسته میپردازد، به عبارتی زمانی که در یک تحقیق هدف مقایسه یک متغیر در دو وضعیت متفاوت باشد و در صورت عدم برقراری فرض نرمال بودن نمونه می توان از آزمون های ناپارامتری مانند آزمون علامت، آزمون ویلکاکسون و آزمون مک نمار برای مقایسه دو گروه وابسته استفاده نمود. در آزمون ویلکاکسون الزامی در مورد نوع توزیع متغیر مورد نظر وجود ندارد اما مقادیر متغیر مورد نظر باید پیوستگی داشته و مقیاس آن از نوع ترتیبی باشد. به عبارت دیگر اجرای این آزمون برای متغیرهایی که دارای مقوله های محدودی هستند امکان پذیر نیست.

ويلكاكسون، آزمون ناپارامتريك جهت متغيرهايي با مقياس رتبه‌اي مي‌باشد. از طريق اين آزمون، امكان مقايسه قبل و بعد يك وضعيت تحت تاثير يك متغير امكان پذير است. فرض كنيد محققي مي‌خواهد تاثير استفاده از وسايل كمك آموزشي و سمعي ـ بصري را روي نتيجه آزمون دانشجويان بررسي كند. ابتدا از دانشجويان آزمون به عمل مي‌آيد، سپس از وسايل كمك آموزشي استفاده مي‌شود و مجددا آزمون برگزارمي‌گردد.

6-آزمون کروسکال والیس(kruskal-wallis): محقق اختلاف بین بیش از دو گروه از متغیرهای رتبه ای را اندازه گیری میکند. يك آزمون غير پارامتري و از سري آزمون هاي آناليز واريانس محسوب مي شود، براي مقايسه هاي سه و بيشتر از سه گروه استفاده مي كنيم. روش كروسكال- واليس اين فرضيه را كه k گروه نمونه از يك جامعه آماري مشترك يا جامعه آماري شبيه به هم كه با توجه به ميانگين ها استخراج شده اند، آزمون مي كند.

هنگامي‌كه داده‌ها در مقياس رتبه‌اي ‌باشند، جهت مقايسه وضعيت يك متغير در چند گروه، از اين آزمون استفاده مي‌شود. آزمون كروسكال واليس ، معادل تحليل واريانس يك طرفه در آزمونهاي پارامتريك است.

7-آزمون کوکران(Cochrans Q): جهت مقایسه اختلاف نمرات با متغیر اسمی دو حالته در فاصله زمانی بیش از دو بار استفاده میشود. مثال: بررسی اثرات داروی الف در چهار زمان متفاوت بعد از مصرف دارو.

اگر متغيرهاي مورد بررسي داراي مقياس اسمي‌باشند، جهت آزمون تفاوت بين k گروه وابسته مي‌توان از آزمون كوكران استفاده كرد.

8-آزمون کلموگروف-اسمیرنوف(Kolmogorov-smirnov): پس از بررسی عادی یا نرمال بودن کشیدگی و یا چولگی توزیع داده ها، از آزمون شاپیرو -ویلک یا آزمون کولموگروف –اسمیرنف استفاده می شود تا از نرمال بودن داده ها اطمینان حاصل گردد. اين آزمون به عنوان يک آزمون تطابق توزيع برای داده های کمی است. فرض کنيد محققی نمونه ای از انداره های کمی در اختيار دارد و می خواهد تعيين کند که آيا اين نمونه از جامعه ای با توزيع نرمال بدست آمده است يا خير؟ آزمون نرمال بودن يک توزيع يکی از شايع ترين آزمون ها برای نمونه های کوچک است که محقق به نرمال بودن آن شک دارد. برای اين هدف آزمون K-S، آزمون مناسبی است.

9- آزمون ناپارامتری علامت(Sign): برای مقایسه دو گروه وابسته بکار میرود. در آزمون دو گروهی وابسته مقایسه ای بین قبل و بعد از تاثیر عاملی یا صفتی در یک گروه انجام می گیرد.

همبستگي(Correlation):

 به روابط بین دو یا چند متغیر که قابل تبدیل به یکدیگر هستند اطلاق میشود. در واقع جهت و شدت رابطه بین دو متغیر را نشان میدهد. در پروژه‌هاي تحقيقاتي که شامل چند متغير است، ميل داريم بدانيم که يک متغير با متغير ديگر چه رابطه‌اي دارد. بدان معنا که نياز داريم ماهيت، جهت و معنا داري روابط متغيري را بدانيم. همبستگي از ارزيابي تغييرات يک متغير براثر تغييرات متغير ديگر بدست مي‌آيد. دامنه همبستگي بين 1+ و 1- مي‌باشد.

1-همبستگی پیرسون و رگرسیون ساده : برای توصیف همبستگی بین متغیرهایی که در مقیاس فاصله ای یا نسبتی اندازه گیری شده اند از ضریب همبستگی پیرسون استفاده میشود. در این آزمون هدف تعیین رابطه بین دو متغیر x و y است که توسط آزمون تحلیل واریانس مشخص می شود. هرچه مثبت تر باشد همبستگی قویتر است.

2- ضریب همبستگی اسپیرمن: برای توصیف همبستگی بین متغیرهایی که در مقیاس رتبه ای اندازه گیری شده اند از ضریب همبستگی اسپیرمن استفاده میشود.

2- همبستگی تائوکندال: یک ضریب همبستگی دو متغیری برای داده های رتبه ای است. مثل تعیین ارتباط معدل با میزان تحصیلات مادر.

رگرسيون چندگانه:

رگرسيون به معناي بازگشت, و نشان دهنده آنست که مقدار يک متغير به متغير ديگري برمي‌گردد. گاهي دو يا چند متغير تاثير عمده‌اي روي متغيـر وابستـه‌اي دارنـد، رگـرسيون چنـدگانه، روشي است که بتوان تاثير همزمان و خطي دو يا چند متغير را روي متغير وابسته‌اي اندازه گرفت. مثال: «تعداد فروش، به ميزان تبليغات،تعداد فروشندگان و... بستگي دارد.»