امروز پنجشنبه 01 آذر 1403 http://u24.cloob24.com
0

در توزیع تک متغیری با چه سوالاتی روبرو هستیم؟ توضیح تفضیلی.

- پاسخ

با توجه به اینکه هدف توزیع‏های تک متغیری اینست که تغییرات متغیرها را بطور جداگانه در جامعه معینی توصیف کند، باید وضعیت جامعه را نسبت به آن متغیر بدانیم. بنابراین باید به سوالات زیر پاسخ دهیم:

1-الگوی کلی داده ها چگونه است؟

جدول توزیع فراوانی:

یکی از کارآمدترین روشها برای خلاصه و سازمان بندی کردن اطلاعات جدول توزیع فراوانی می باشد.توزیع فراوانی عبارت است از سازمان دادن به اندازه ها یا مشاهده ها به وسیله در آوردن آنها در قاب طبقه ها همراه با ذکر فراوانی هر طبقه.یکی از نقاط ضعف نمایش داده ها به وسیله جدول فراوانی این است که اطلاعات جدول رو نمی توان به سرعت درک کرد.بنابراین به منظور دریافت تصویر روشن تری از داده های جمع آوری شده از نمودار استفاده می شود.

نمودار و انواع آن:

نمودار ابزاری تصویری است که برای توصیف و نمایش داده های جمع آوری شده به کار برده می شود.پس از سازمان بندی کردن داده ها در جدول توزیع فراوانی،غالبا نمایش آن ها به وسیله نمودار به پژوهشگر کمک می کند تا ویژگیهای داده ها را بهتر و آسان تر توصیف کند.

برای بررسی نمایش گرافیکی داده ها بصورت نمودار می توانیم از نمودارهای زیر استفاده کنیم:

نمودار ستونی

رایج‌ترین نوع نمودارها، نمودار ستونی افقی یا عمودی است که از نظر خواندن، ساده‌ترین نوع نمودار است. تهیه این نوع نمودار نیز بسیار آسان است، به این ترتیب که هر دسته از اطلاعات را در یک ستون قرار می‌دهیم. از نمودار ستونی بیشتر برای مقایسه استفاده می شود که ستون‌ها را با گذاشتن فاصله‌هایی میان آنها از هم جدا می‌کنند. این ستون‌ها یا همگی افقی هستند یا عمودی، برای مقایسه اجزاء تشکیل‌دهنده یک کمیت در یک زمان معین از ستون‌های افقی استفاده می‌شود و برای مقایسه اجزا در زمان‌های مختلف ستون‌های عمودی به کار می‌رود.به دیگر سخن،از این نمودار زمانی استفاده می شود که داده های جمع آوری شده به متغیرهای گسسته تعلق داشته باشند و با استفاده از مقیاس اسمی اندازه گیری شده باشند.

با استفاده از نمودار باکس - ویسکر می توان اطلاعات زیر را در مورد داده ها کسب نمود:

الف) اگر میانه نزدیک وسط مستطیل (باکس) باشد توزیع داده ها تقریبا متقارن است.

ب) اگر میانه در طرف چپ وسط مستطیل باشد توزیع چوله به راست و اگر میانه در طرف راست وسط مستطیل قرار گیرد توزیع چوله به چپ است.

ج) اگر خطوط دو طرف مستطیل (ویسکرها) تقریباً برابر باشند توزیع داده ها به توزیع متقارن نزدیک بوده و در صورت نامساوی بوده خطوط توزیع دارای چولگی است.

د) در مقایسه نمودار باکس - ویسکر دو مجموعه از داده ها می توان پراکندگی آنها را با توجه به طول مستطیل های نمودار با یکدیگر مقایسه نمود. مستطیلی که طول بزرگتری دارد دارای پراکندگی بیشتر می باشد.

ه) داده های پرت ضعیف و داده های پرت قوی را با استفاده از نمودار باکس - ویسکر می توان تعیین نمود.

نمودار شاخه و برگ

این نمودار نیز برای توصیف داده های کمی به کاربرده می‏شود. رسم نمودار شاخه و برگ به دلیل از دست ندادن اطلاعات، به نمودارهای فراوانی ترجیح داده می شود. هر داده یک ساقه و یک برگ دارد. معمولا برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند. برای مثال در عدد 317 عدد 7 برگ و 31 ساقه است. یک‌ نمودار منعکس‌ کننده‌ توزیع‌ فراوانی‌ و هیستوگرام‌ است‌ و ضمن‌ نشان‌ دادن‌ شکل‌ هیستوگرام‌، داده‌ های‌ اصلی‌ را نیز نشان‌ می‏دهد. در این نمودار بجای رسم میله‌ها، فراوانی‌ها به شکل اعداد (با نمایش تعداد تکرار و بیان اعداد مشاهده شده) نشان داده می شوند.

روش ترسیم:

1. هر داده به دو قسمت تقسیم می شود. یک قسمت از داده ساقه و قسمت دیگر برگ است. برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند.

2. ساقه ها به ترتیب از کوچک به بزرگ مرتب می شوند.

3. هر برگ به ساقه مناسب اضافه می شود.

با مقایسه نمودار نمودار شاخه و برگ و نمودار هیستوگرام دیده می‌شود که در نمودار هیستوگرام با ایجاد طبقات دیگر دستیابی به مقادیر انفرادی مشاهدات امکان پذیر نیست اما در نمودار شاخه و برگ ضمن داشتن ایده تصویری از نحوه توزیع داده ها به یکایک اطلاعات نیز دسترسی داریم.

نمودار میله ای

برای داده های کمی گسسته، وقتیکه از رده ها استفاده می شود، نمودار میله‌ای مناسب ترین نمودار است که همانند داده های کیفی رسم می شود، با این تفاوت که به جای گروههای مختلف داده کیفی از رده ها در محور افقی استفاده می شود.

نمودار چند گوش:

این نمودارها برای نمایش داده های کمی گسسته به کار می روند.

نمودار راداری (Radar Chart):

نوعی از نمودار خطی است. با این تفاوت که نمودار مزبور بجای اینکه نسبت به محور ترسیم شود، نسبت به یک نقطه مرکزی ترسیم می شود. یعنی خط افقی در نمودار خطی، در نمودار راداری بصورت دایره نشان داده می‏شود.

به نمودار راداری نمودار تار عنکبوتی یا گراف ستاره ای نیز گفته می شود که بیشتر به منظور نمایش مشاهدات چند متغیره استفاده می‏شود. یک نمودار راداری شامل مجموعه ای از پره (محور) های متساوی الزاویه بوده که هر یک بیان کننده یک متغیر می باشد. یک داده از یک متغیر بر روی محور مربوطه چنان نگاشته می شود که فاصله آن از مرکز نسبت به طول محور برابر با مقدار آن متغیر نسبت به بیشینه مقدار ممکن متغیر باشد. خطوطی نقاط مجاور را به یکدیگر متصل کرده و نهایتاً یک چند ضلعی مشخص حاصل از مشاهدات بدست می آید. بنابراین نمودار راداری تنها با یک چند ضلعی به محقق کمک کرده تا متغیر (متغیرهای) غالب را برای یک سری مشاهدات تشخیص دهد.

نمودار پراکنش

ارائه داده های دو متغیره کمی بوسیله نمودار پراکنش در بسیاری از مطالعات با ثبت دو صفت کمی به دنبال یافتن رابطه بین دو صفت برای واحدهای مطالعاتی می باشیم. اگر مقادیر دو صفت را با x و y نمایش دهیم آنگاه برای هر کدام از مشاهدات یک زوج مشاهده داریم. با رسم این زوج مشاهدات در محورهای مختصات، نمودار حاصل را نمودار پراکنش می‌نامند.

حد متوسط عملکرد گروه چگونه است؟

برای پاسخ به این سوال باید شاخص های مرکزیت (میانگین، میانه، نما) داده ها را مشخص کنیم.

شاخص های مرکزی یا گرایش به مرکز شاخص هایی هستندکه با استفاده ازآنها مجموعه ای ازداده ها در یک مقدار یا عدد که نماینده ی آن مجموعه است خلاصه می شود.به دیگر سخن،این شاخص حد متوسط رانشان می دهد و نماینده مجموعه ی از اعداد هستند.نما و میانه و میانگین (mean, median, mode) سه شاخص مرکزی هستند.

نما mode:

ساده ترین شاخص گرایش مرکزی است، نما عددی است که دارای بیشترین فراوانی است. عددی که دارای بیشترین فراوانی است،اغلب نزدیک به مرکز توزیع فراوانی قرار دارد. درچنین شرایطی نما یک شاخص مرکزی است. اما نما همیشه در مرکز توزیع فراوانی قرار ندارد، به همین دلیل نمی توان به عنوان یک شاخص مرکزی به آن اطمینان داشت. در میان شاخص های گرایش به مرکزیت نما شاخصی بی ثبات است. به توزیع فراوانی که فقط یک نما دارد، یک نمایی و به توزیعی که دونما دارد، توزیع دونمایی می گویند و به توزیع بیش از دونما، توزیع چند نمایی گفته می شود. از نما هنگامی استفاده می کنیم که مقیاس اندازه گیری اسمی باشد و یک برآورد تقریبی از ارزش های مرکزی کفایت کند.به عبارتی دیگر،نما به عنوان یک شاخص مرکزی مورد استفاده محدودی دارد.نما مخصوصا در گروه های کوچک دارای اعتبار نیست.زیرا میزان آن فقط تابع چند عدد است.پژوهشگران معمولا هنگامی از نما استفاده می کنند که مایل باشند بینش کلی درباره شاخص مرکزی به دست آورند.این شاخص درباره گرایش مرکزی تزیع نمره ها اطلاعی به ما نمی دهد.زیرا شاخص مرکزی یک توزیع الزاما عدد با ارزشی نیست که دارای بیشترین فراوانی باشد.

میانه median:

میانه نقطه وسط یک توزیع است. هنگامی که نمرات توزیع فراوانی به ترتیب از بالاترین به پایین ترین نمره مرتب شود، نصف نمرات بالای میانه و نصف نمرات پایین میانه قرار می‏گیرد، بنابراین میانه نقطه 50درصدی است. اندازه یا حجم واحدهای اندازه‏گیری در میانه تاثیر ندارد. ثبات آن از میانگین کمتر ولی از نما بیشتراست. میانه با مقیاس های ترتیبی، فاصله ای و نسبی به کاربرده می شود.ویژگی اصلی میانه این است نسبت به اعداد کوچک و بزرگ حساس نیست.

میانگین mean:

معتبرترین شاخص گرایش مرکزی میانگین است.میانگین معدل حسابی گروهی از نمرات است که از طریق جمع کردن تمام نمرات و تقسیم حاصل جمع بر تعداد کل نمرات به دست می آید. از ویژگی های عمده میانگین این است که این شاخص نسبت به تک تک اعداد توزیع فراوانی حساس است.اگر میانگین را ضربدر تک تک اعداد کنیم مجموع آن بدست می آید.همچنین میانگین مرکز ثقل داده هاست.یعنی مجموع نمرات انحرافی همیشه صفر است. یکی دیگر از ویژگی های میانگین این است که میانگین، نقطه ای از توزیع نمرات است که همیشه مجموع مجذور در انحراف نمرات از میانگین کوچکتر یا مساوی با مجموع مجذور در انحراف نمرات از هر عددی دیگر است. همچنین با مقیاس های فاصله ای و نسبی به کار برده می شود، و به استفاده کنندگان خود اجازه عملیات ریاضی رو می دهد،به همین دلیل مورد استفاده زیادی در آمار استنباطی دارد. و انواع مختلفی دارد.

داده ها حول این حد متوسط چقدر از یکدیگر فاصله دارند؟

پژوهشگر برای توصیف کامل توزیع نمره ها علاوه بر شاخصهای مرکزی،به پراکندگی نمره ها نیز نیاز دارد.به دیگر سخن،برای یک مجموعه داده ها،علاوه بر شاخص گرایش به مرکز،شاخصهای دیگر وجود دارند به نام شاخص های پراکندگی؛در واقع بیانگر فاصله،تغییرات،پراکندگی و انحرافات را نشان می دهند.شاخص های پراکندگی میزان پراکندگی یا تفسیر نمره‏ها را درمجموعه‏ای از نمرات نشان می‏دهند.دامنه ی تغییرات،انحراف چارکی،انحراف متوسط،واریانس و انحراف معیار شاخصهایی هستند که به منظور پراکندگی نمره ها به کار برده می شوند.افزون بر این،وجود یا عدم پراکندگی ضرورتا نه خوب است نه بد.قضاوت در این مورد با توجه به هدف پژوهش صورت می گیرد.

دامنه ی تغییرات:

ساده ترین شاخص پراکندگی دامنه‏ی تغییرات است که دریک توزیع فراوانی عبارتست از تفاضل بزرگترین وکوچکترین نمره، درواقع دامنه ی تغییرات یک شاخص پایدار پراکندگی نیست، زیرا مقدار آن با تغیر یک نمره (بزرگترین وکوچکترین) تغییر می‏کند. استفاده ازدامنه‏ی تغیرات مستلزم داشتن مقیاس فاصله‏ای است.دامنه تغیرات بی ثبات ترین و بی اعتبار ترین شاخص پراکندگی است.چون در محاسبه دامنه تغییرات فقط دو عدد مورد استفاده قرار می گیرد.به علاوه،چون که دامنه تغییرات بر اساس بزرگترین و کوچکترین نمره ای توزیع محاسبه می شود،بنابراین مقدار آن در نمونه های مختلفی که از یک جامعه انتخاب شود،تفاوت خیلی زیادی خواهد داشت.عیب دیگر دامنه ی تغییرات این است که مقدار آن به حجم نمونه بستگی دارد.به طور کلی،هر چه حجم نمونه زیاد باشد،مقدار دامنه تغیرات احتمالا زیاد خواهد شد.

انحراف چارکی:

جزء شاخصهای که معروف به چند دهکها مربوط می شوند.و با دو نقطه-25./. و 75./.- سرو کار دارد.این شاخص پایدارتر از دامنه‏ی تغییرات است و مساوی است با نصف تفاضل بین چارک سوم و اول. انحراف چارکی مانند میانه تحت تاثیر نمره های خیلی بزرگ یا خیلی کوچک قرار نمی گیرد. از انحراف چارکی زمانی استفاده می شود که مقیاس اندازه‏گیری حداقل فاصله‏ای باشد.هنگامی که میانه مناسب ترین شاخص مرکزی توزیع نمره ها باشد می توان از انحراف چارکی برای محاسبه پراکندگی استفاده کرد.هنگامی که نمودار نمره ها دارای کجی باشد،انحراف چارکی شاخص مناسبی برای نشان دادن پراکندگی است.

انحراف متوسط:

در آمار فاصله بین هر عدد از یکی از شاخصهای مرکزی،انحراف نامیده می شود. میانگین قدر مطلق انحرافات از میانگین را نیز انحراف متوسط گویند.به زبان ساده،انحراف متوسط،میانگین مجموع قدر مطلق انحرافات گویند.برای استفاده از انحراف متوسط،مقیاس اندازه گیری باید حداقل فاصله ای باشد.زیرا برای تفسیر نتایج تحقیق،دانستن فاصله نمره ها از میانگین ضروری می باشد و برای محاسبه میانگین نیز،داشتن مقیاس فاصله ای ضروری است.عیب این شاخص در قدر مطلق آن است یعنی قدر مطلق اجازه عملیات آماری با این فرمول رو نمی دهد و باید آن رو مجذور کنیم.

واریانس:

قبلا گفته شد که از بین شاخصهای مرکزی،میانگین شاخص با ثبات و معتبر تری است.در صورتی که بتوانیم فاصله بین هر یک از اعداد تا میانگین را تعیین کنیم آنگاه قادر خواهیم بود تا یک شاخص پراکندگی با ثبات و معتبر را محاسبه کنیم.این روش در محاسبه واریانس و انحراف استاندارد به کار برده می شود. واریانس یک شاخص پراکندگی است که از طریق محاسبه ی انحراف نمره ها ازمیانگین محاسبه می شود. برابر است با مجذور انحراف نمره ها از میانگین(میانگین مجموع مجذور انحرافات) یا مجموع مجذور انحراف نمره ها از میانگین تقسیم برتعداد نمره ها.در محاسبه انحراف متوسط،علائم اعداد و در محاسبه انحراف چارکی،کلیه ارزشهای مقداری تمام اعداد مورد بررسی قرار نمی گیرد.برای محاسبه یک شاخص پراکندگی باثبات و معتبر باید از ارزشهای عددی کلیه نمره ها استفاده کرد.در مجموع، با مجذور کردن انحراف نمره ها از میانگین،واحد واریانس یا واحد اندازه گیری تغییر پیدا خواهد کرد که نقطه ی ضعف واریانس است که با جذر واریانس مشکل حل خواهد شد.

انحراف استاندارد (انحراف معیار):

مشکل اختلاف واحد اندازه‏گیری با واریانس را می‏توان با جذر گرفتن از واریانس حل کرد. این عمل موجب می‏شود که واحد شاخص محاسبه شده با واحد اندازه گیری به کاربرده شده یکسان شود و یکی از شاخص های معتبر آماری به نام انحراف استاندارد بدست آید. به عبارت دیگر جذر واریانس، انحراف استاندارد نامیده می شود. انحراف استاندارد مفیدترین و متداول ترین شاخص پراکندگی است. مفیدبودن این شاخص به این دلیل است که بااین شاخص می‏توان میزان پراکندگی هر توزیع پیوسته را برحسب واحد اندازه‏گیری نشان داد. این شاخص دقیق ترین شاخص پراکندگی است. استفاده از انحراف استاندارد مستلزم این است که مقیاس اندازه گیری به کاربرده شده حداقل فاصله ای باشد.افزون بر این،انحراف استاندارد،شاخصی است که به منظور تعییت تغییرات یا پراکندگی توزیع نمره ها به کار برده می شود.مقدار انحراف استاندارد به تناسب تغییر در پراکندگی نمره ها تغیر می کند.در صوری که توزیع نمره ها نسبت به میانگین پراکندگی زیادی داشته باشد،مجموع مجذور انحراف نمره ها از میانگین، و در نتیجه انحراف استاندارد بزرگ خواهد شد.همچنین عکس آن هم صادق است.

شکل توزیع داده ها چگونه است؟

برای پاسخ به این سوال باید شکل توزیع (نرمال، کجی و کشیدگی) داده ها را مشخص کنیم.

شکل توزیع به سه صورت است:

نرمال یا متقارن: در منحنی نرمال در حالت تقارن مد، میانه و میانگین برابر است.

- کجی (Skewness): کجی یعنی انحراف یک منحنی از حالت تقارن.کجی به سه صورت است،در حالتی کجی صفر است که منحنی متقارن باشد.در توزیعهای متقارن فاصله بین چارک اول تا میانه با فاصله بین چارک سوم تا میانه مساوی است. در حالت کجی منفی مد بزرگتر از میانه و میانه بزرگتر از میانگین است(بیانگر این است که افراد زیادی نمره ی بالایی گرفته اند و بنابراین امتحان ساده بوده است). در حالت کجی مثبت نیز میانگین بزرگتر از میانه و میانه بزرگتر از مد است(یعنی آزمون دشوار بوده است).

- کشیدگی: هنگامی که مقدار کشیدگی برابر صفر باشد توزیع نمره ها طبیعی است یعنی در شکل توزیع که بلند و رو به بالاست، نمرات نزدیک به هم یا یکسان می باشند و واریانس کم است.در صورتی که کشیدگی مثبت باشد برآمدگی منحنی توزیع نمره ها در نقطه اوج قرار خواهد گرفت. در شکل توزیع مسطح که کشیدگی منفی دارد، نمرات دور از هم‌ قرار دارند و واریانس زیاد است. میزان کشیدگی یا پخی منحنی فراوانی را نسبت به منحنی نرمال استاندارد، برجستگی آن می نامند.

جایگاه داده ها نسبت به یکدیگر چگونه است؟

در واقع این سوال،روش های تفسیر نمره های خام را مورد بررسی خواهد داد.در این بحث اندازه ها یا شاخصهایی که موقعیت نسبی فرد یا عدد را در گروه یا توزیع نمره ها مشخص می کند. برای تعیین موقعیت نسبی هر یک از اعداد در توزیع نمره هایشان از شاخصهای مختلفی منجمله رتبه درصدی،رتبه نسبی و نمره های استاندارد استفاده خواهیم کرد.

رتبه درصدی:

رتبه درصددی،رتبه نسبی یک نمره از توزیع نمره ها را براساس مقیاس 100 تعیین می کند.رتبه درصدی یک نمره به ما می گوید که چند درصد نمره ها در توزیع در زیر آن نمره قرار گرفته اند.رتبه درصددی یک شاخص آماری رتبه ای است.رتبه در صورتی دارای معنی است که تعداد نمره ها در توزیع مشخص باشد.این شاخص معیاری برای تفسیر و مقایسه نمره ها در گروه یا توزیع فراهم می کند.رتبه درصددی وضعیت فرد را فقط در درون یک جامعه معین مشخص می کند و وقتی دارای معنی است که ماهیت مقایسه گروهی معلوم باشد.

نقاط درصددی:

نقاط درصددی همانند رتبه های درصدی اندازه های ترتیبی هستند.با استفاده از انها می توان تعیین کرد چه عددی توزیع را به درصددهای مختلف تقسیم می کند.بنابراین نقاط درصددی نقاطی بر روی مقیاس نمره هاست که معادل رتبه های درصدی اند.نقاط درصدی زمانی به کاربرده می شوند که پزوهشگر بخواهد از یک جامعه قسمتی یا تعدادی را انتخاب کند.به عنوان مثال ممکن است مدیر یک کارخانه از بین داوطلبان استخدام کسانی را انتخاب کند که به 30 درصدد سوالات ازمون استخدامی پاسخ صحیح داده باشند.

نمره استاندارد:

از نمره استاندارد Z زمانی استفاده می‌کنیم که می‏خواهیم دو نمره خام را قابل مقایسه کنیم. یعنی مبدا و مقیاس نمرات را یکی می‌کنیم. به کمک این نمره مى‌توان تفاوت موجود در پراکندگى نمرات را بوسیله تقسیم انحراف هر نمره از میانگین بر انحراف استاندارد آن نمرات رفع کرد و نمره‌‌ها را با یکدیگر مقایسه نمود.به عبارتی دیگر،نمره های استاندارد،وضعیت افراد یا نمره ها را نسبت به میانگین تعیین می کنند.نمره های استاندارد با مقیاس فاصله ای به کاربرده می شوند و همانند رتبه های درصددی به منظور تعیین موقعیت فرد در درون گروه به کار برده می شوند.افزون بر این،نمره های استاندارد مستقیما از نمره های خام به دست می آیند ب)چون با مقیاس فاصله ای به کاربرده می شوند بنابراین محاسبات ریاضی با آنها امکان پذیر است.نمره های استاندارد تعیین می کنند که یک نمره،چند انحراف استاندارد بالاتر یا پایین تر از میانگین قرار دارد. نمره های T و نه گانه هم جزء نمره های استاندارد هستند.

در پایان به عنوان ماحصل بحث می توان گفت که آمار توصیفی تک متغیری شامل نمایش گرافیکی (جدول، نمودار) و شاخص‌های عددی است که شامل شاخص‌های مرکزی، شاخص‌های پراکندگی و شکل توزیع است. اما در توزیع چند متغیری چونrelationship متغیرها مطرح می باشد، اثر متقابل متغیرها علاوه بر اثر کلی مورد علاقه پژوهشگر می باشد.

تبلیغات متنی
فروشگاه ساز رایگان فایل - سیستم همکاری در فروش فایل
بدون هیچ گونه سرمایه ای از اینترنت کسب درآمد کنید.
بهترین فرصت برای مدیران وبلاگ و وب سایتها برای کسب درآمد از اینترنت
WwW.PnuBlog.Com
ارسال دیدگاه