وجود داده های پرت در بین داده ها موجب بروز مشکلاتی در تحلیلها خواهد شد. این داده های پرت موجب بدست آمدن غیر صحیح برآوردها می شود.همچنین وجود داده های پرت در نرمال بودن یا نبودن داده ها نیز بسیار موثر است و یکی از راه های نرمال سازی داده ها بررسی داده های پرت است.

راه های بررسی داده های پرت:

  • رسم نمودار باکس پلات

  • محاسبه نمره z استاندارد داده ها .اگر نمره z داده ها به اندازه ۲٫۵ انحراف معیار بالاتر یا پایینتر از میانگین باشد می توان گفت داده پرت است.

  • در رگرسیون با فعال کردن گزینه casewise diagnostics می توان این موضوع را بررسی کرد.

  • در واقع داده پرت یعنی فاصله خیلی کم یا خیلی زیاد از میانگین کل داده ها است.

در زیر یک تجربه واقعی و مفید از بررسی داده های پرت آورده شده است:

در تحقیقی(پایانامه کارشناسی ارشد دانشگاه تهران) با موضوع بررسی میزان تاثیر سکوت سازمانی بر سلامت سازمانی دبیران مقطع متوسطه حدود ۳۶۰ پرسشنامه تکمیل شد و داده های آن وارد نرم افزار شد.با توجه به نظریه های موجود و پیشینه تحقیق انتظار داشتیم که همبستگی بین این دو متغیر معنادار و منفی باشد.

در این تحقیق میزان تاثیر سکوت سازمانی بر سلامت سازمانی معنادار نشد( ولی میزان همبستگی ضعیف و منفی بود).بعد از بررسی های بعمل آمده متوجه شدیم که تعدادی از داده ها مزاحم بوده و در برآوردهای همبستگی و ضرایب رگرسیونی بسیار تاثیر گذاشته است.بعد از اینکه داده های پرت را  شناسایی و حذف کردیم.علاوه بر اینکه میزان همبستگی بین دو متغیر بسیار قوی و معنادار شد ، بلکه داده های هر دو متغیر نیز نرمال شدند.

جهت هماهنگی تماس بگیرید:۰۹۳۵۱۳۲۳۹۵۰