شاخص های پراکندگی
مبنای علم پراکندگی یا همان تغییر است و در صورتی که تغییر وجود نداشته باشد، علم نیز بی معناست. علم به دنبال تبیین این پراکندگی ها و تغیرات است.
اندازه های مرکزی مانند میانگین، میانه و نما توصیف کننده وضعیت کامل توزیع داده ها نیستند. به عبارت دیگر دو مجموعه داده که دارای میانگین های یکسان هستند ممکن است پراکندگی متفاوتی داشته باشند و زمانی میتوان توزیع دادهها را دقیقاً توصیف نمود که علاوه بر شناخت معیار مناسبی برای مرکزیت آن، معیاری را هم برای پراکندگی آنها تعیین نمود.کاربرد شاخص های پراکندگی تنها برای داده های فاصله ای و نسبتی است. مهمترین آنها عبارتند از:
دامنه تغییرات، واریانس، انحراف معیار، انحراف چارکی، انحراف متوسط،
دامنه تغییرات به شکل روبرو محاسبه می شود.
که Xn بزرگترین اندازه و X1 کوچکترین اندازه مشاهده شده است.
دامنه نیز همانند میانگین تحت تأثیر داده های پرت قرار می گیرد و در چنین حالاتی یک معیار مناسب پراکندگی نیست. به علاوه، چون برای محاسبه دامنه فقط از دو اندازه بزرگترین مشاهده و کوچکترین مشاهده استفاده می شود معمولاً معیار رضایت بخشی برای پراکندگی به حساب نمی آید.
واریانس و انحراف معیار
مفدیدترین اندازه پراکندگی واریانس و یا جذر آن، انحراف معیار داده ها است. اندازه انحراف معیار به ما می گوید که مشاهدات تا چه مقدار در اطراف میانگین آنها قرار دارند، یک اندازه کم برای انحرف معیار مجموعه ای از داده ها نشان دهنده این واقعیت است که داده ها در دامنه کوچکی حول میانگین پراکنده شدهاند و بالعکس انحراف معیار بزرگ بیان کننده دامنه گستردهتری است که داده ها در حول میانگین پراکنده گردیده اند. انحراف معیار ریشه دوم مثبت واریانس است که برای جامعه آن را با و برای نمونه آن را با s نشان می دهیم. نحوه محاسبه واریانس به این شکل است که جذر آن انحراف معیار را به ما می دهد.
اگر واریانس را از جدول توزیع فراوانی به دست آوریم خواهیم داشت:
اگر همه ی داده های آماری با هم برابر باشند، واریانس و انحراف معیار برابر صفر خواهد بود.
دلیل استفاده از انحراف استاندارد این است که مقیاس2 S با مقیاس نمرات یکی نیست و راه حل استفاده از Sاست.
انحراف استاندارد یکی از مهم ترین شاخصه های هر توزیع آماری است و در توزیع های مختلف به روش های مختلف محاسبه می شود. ممکن است این سوال پرسیده شود که داده های تجربی انطباق دقیق با توزیع های نظری آماری ندارد. برای تعیین شاخص های پراکندگی این توزیعات پژوهشگران چه می کنند؟ این موضوع یکی از دغدغه های پژوهشگران آماری است که از روش های پیچیده ای به محاسبه انحراف استاندارد می پردازند.
انحراف متوسط: (که به آن میانگین قدر مطلق انحراف ها هم می گویند)، فاصله داده Xi از میانگین را انحراف از میانگین Xi گویند که به صورت محاسبه می شود. اگر این مقدار را برای تمامی داده ها محاسبه کنیم و از نتیجه میانگین بگیریم، میانگین انحرافات بدست خواهد آمد که عبارت است از:
از آنجا که میانگین انحرافات به تمام داده ها وابسته است معیار مناسبی برای سنجش پراکندگی داده ها محسوب می شود اما به دلیل وجود قدر مطلق در فرمول، محاسبه آن مشکل است و نمی توان آن را ساده نمود، بنابراین واریانس و انحراف استاندارد شاخص های مناسب تری هستند.
انحراف چارکی
انحراف چارکی عبارت است از: نصف فاصله بین چارکهای اول و سوم و از طریق فرمول زیر بدست می آید:
ابتدا اعداد را از کوچک به بزرگ مرتب می کنیم.
محاسبه میانه یا چارک دوم اعداد
محاسبه میانه اعداد سمت چپ
محاسبه میانه اعداد سمت راست
ویژگیهای انحراف چارک:
انحراف چارکی خیلی کم تحت تأثیر اختلافهای تصادفی بین نمونه های انتخاب شده قرار می گیرد چون همانند میانه تحت تأثیر نمره های خیلی بزرگ یا خیلی کوچک قرار نمی گیرد. شرایط استفاده آن همانند میانه است و هر دو یک خانواده آماری را تشکیل می دهند. در زمانی مورد استفاده قرار می گیرند که مقیاس حداقل فاصله ای باشد.
توزیع نرمال و شکل آن:
توزیع نرمال یکی از توزیعهای احتمالاتی پیوسته مهم است. توزیع نرمال استاندارد توزیعی با میانگین صفرو انحراف استاندارد واحد است. به علت شباهت این شکل به زنگوله به آن انحنای زنگولهای نیز گفته میشود.
دلیل اهمیت توزیع نرمال از وجود قضیه حد مرکزی ناشی میشود. این قضیه میگوید هنگامی که تعداد بسیار زیادی متغیر تصادفی با توزیع دلخواه و با واریانس محدود را با هم جمع کنیم و میانگین بگیریم، توزیع نهایی به توزیع نرمال میل میکند. به همین خاطر
هنگامی که شاهد تأثیر جمعی بسیاری از پدیدههای تصادفی هستیم، نتیجه نهایی با توزیع نرمال قابل توصیف است.
این منحنی دارای خواص بسیار جالبی است از آن جمله که نسبت به محور عمودی متقارن می باشد، نیمی از مساحت زیر منحنی بالای مقدار متوسط و نیمه دیگر در پایین مقدار متوسط قرار دارد و اینکه هرچه از طرفین به مرکز مختصات نزدیک می شویم، ارتفاع منحنی بیشتر می شود.
شاخص های نماینده توزیع نرمال:
میانگین (µ): نشان دهنده تراکم داده ها حول یک مقدار
انحراف معیار (σ): نشان دهنده میزان پراکندگی داده ها از میانگین
مثال کاربرد µ و σ:
با رسم نمودار فراوانی داده های پیوسته عموما یکی از اشکال زیر بدست می آید؛ که چگونگی قرار گرفتن میانگین و میانه ومد را در اشکال زیر مشاهده می شود.
کجی به 2 دلیل ایجاد می شود:
متغیر ماهیتا کجی دارد: مثل بزهکاری که در این موارد باید از آزمون های ناپارامتری استفاده کنیم مثلا به جای مقایسه میانگین ها از میانه استفاده می کنیم.
داده های پرت باعث کجی شده اند.
راه حل این مشکل این 3 راهکار است: حذف(برای مقادیر پرت)، وینزوری کردن (آرایش کردن)، Trimned (پیرایش کردن)
در تحلیل داده ها اولین قدم تمییز کردن داده هاست. روش هایی که برای برخورد با داده های گمشده وجود دارد می تواند برای برخورد با داده های پرت نیز استفاده شود. این روش ها گستره ای از حذف تا شبیه سازی کردن داده ها را در بر می گیرد. نرم افزار SPSS ورژن 19 که متعلق به شرکت آی بی ام است، فرمان های اشاره شده را داراست.
ضریب کشیدگی: نشان دهنده میزان کشیدگی منحنی می باشد و به صورت زیر تعریف می شود:
دو منحنی زیر متقارن می باشند اما ضریب کشیدگی در آنها متفاوت است:
یکی از کاربردهای مهم منحنی نرمال سطوح زیر منحنی آن می باشد. کاربرد این سطوح را می توان در تعیین فاصله ی اطمینان و همچنین تعیین نقاط برش برای متغیرهای دارای توزیع نرمال مشاهده کرد.
سطح زیر منحنی نرمال برای مقادیر متفاوت
یکی دیگر از مهمترین منحنی های وابسته به منحنی نرمال منحنی اجایو نرمال یا همان منحنی تراکمی نرمال است. این منحنی یکی از پرکاربرد ترین منحنی ها در علوم مختلف و مخصوصا علوم انسانی است. این منحنی در روانسنجی و مخصوصا نظریه ی جدید روانسنجی یعنی نظریه ی سوال پاسخ استفاده می شود. با توجه به اینگه بسیاری از فرایندهای موجود در طبیعت و در علوم مختلف مانند مدیریت, کنترل پروژه از این منحنی پیروی می کنند در برآورد پارامترهای مختلف یا برنامه ریزی به فراوانی مورد استفاده قرار می گیرد. یکی از کاربردهای مهم این منحنی در روانشناسی بالینی استفاده از آن برای پیدا کردن الگوهای رشد است. از آنجا که رشد دارای الگویی مانند منحنی نرمال تراکمی است می توان از آن در روانشناسی رشد و یا در شبیه سازی ها استفاده نمود. کاربرد این منحنی را می توان در آی تی و در هوش مصنوعی و داده کاوی مشاهده کرد. در زیر شکلی از این منحنی ارائه شده است.
از آنجا که تابع اجایو نرمال شناخته شده است و همچنین به دلیل شباهتی که بین این تابع با تابع لجستیک دارد با اضافه کردن مقدار ثابت در فرمول های مربوط به تابع لجستک آنها را به تابع نرمال تراکمی تبدیل می کنند. بنابراین کارکردهای زیادی که برای تابع لجستیک متصور است برای تابع اجایو نرمال نیز قابل تصور خواهد بود.
بسیاری از توابع دیگر مانند دوجمله به تابع نرمال تقریب زده می شوند و در ضمن بسیاری از توابع قابل تبدیل به تابع نرمال اند مانند تابع فیشر یا همان تابع معروف F و یا تابع خی دو.
گاهی در مطالعاتی که انجام می شود، نیاز است علاوه بر اینکه تک تک متغیرها نرمال باشند، ترکیب آنها نیز نرمال باشد. به این حالت نرمال بودن چندگانه می گویند. شکل زیر نرمال بودن دو متغیر را به صورت هم زمان نشان می دهد.
- لینک منبع
تاریخ: جمعه , 26 اسفند 1401 (19:54)
- گزارش تخلف مطلب