روش تدریس ریاضی و آمار

روش تدریس ریاضی و آمار
آشنایی با علم آمار
از مطالبی شروع میکنیم که در هر سه کتاب ریاضی و آمار یک، دو و سه وجود دارد. آمار، همانطور که استحضار دارید، روشهای علمیبرای جمعآوری، تنظیم، دستهبندی و تجزیه و تحلیلِ گزارشی از دادهها جهت رسیدن به نتایج روشن و اتخاذ تصمیمات منطقی است. به طور کلی آمار به دو دسته تقسیم میشود: آمار توصیفی و آمار استنباطی؛ آمار توصیفی قسمتی از روشهای آماری است که نتایج را برای جامعهی بزرگتر تعمیم نمیدهد؛ روشهای عددي، نموداري و جدولی، هستند که در خلاصه کردن دادهها استفاده میشوند. متداولترین مقدار عددي آمار توصیفی متوسط یا میانگین است.
محاسبه شاخصها و پارامترها در جامعه است و اگر در نمونه انجام میدهید فقط آن را محاسبه کنید و اینکه آن را با چه احتمالی به نمونه تعمیم دهیم، همان آمار استنباطی است. آمار استنباطی قسمتی از علم آمار است که نتایج حاصل از نمونه را به جامعه تعمیم میدهد.
با وجود اینکه آمار را به دو قسمت آمار توصیفی و آمار استنباطی تقسیم کردهایم سهم هرکدام برابر نیست، بلکه سهم آنها 2درصد در مقابل 98درصد است؛ یعنی قسمت عمدهی آمار، آمار استنباطی است که ما باید بتوانیم نتایجی که از نمونه بهدست آوردیم به جامعه تعمیم دهیم. (کلی سازی از نمونه به جامعه، انجام آزمونهای آماری، تعیین روابط بین متغیرها و پیشبینی کردن)
استنباط در آمار
همچنین آمار استنباطی نیز به دو دسته تقسیم میشود: آمار پارامتری و آمار ناپارامتری؛ در آمار پارامتری توزیعی، در رابطه با صفتی که مورد بررسی قرار میدهیم که به آن متغیر نیز میگوییم نسبت داده میشود. برای مثال توزیع یک متغیر، نرمال یا نمایی یا گاما است. به طور معمول توزیع نرمال درنظر گرفته میشود. اگر توزیع یک متغیر را بدانیم به آن آمار پارامتری میگویند؛ اما اگر توزیع نامعلوم باشد به آن آمار ناپارامتری میگویند.
فرض کنید میخواهید آزمونِ فرض انجام دهید تا ببینید که میانگین نمرات دانشآموزان یک مدرسه بالاتر از نمرهی 15 هست یا خیر. یک نمونه 10 یا 15 تایی از دانشآموزان را انتخاب کرده و فرض میکنیم که میانگین 15 است اما میانگین بزرگتر از 15 است. اگر توزیع دادهها نرمال باشد اصطلاحا از آزمونT استفاده میکنیم که به آن آمار پارامتری میگویند. اگر توزیع دادهها نرمال نباشد مجاز نیستیم از آزمون T استفاده کنیم و در این صورت از آزمونهای ناپارامتری دیگری مانند “آزمون ویلکاکسون” استفاده میکنیم.
مختصری از توزیع
توزیع فراوانی خلاصه جدولی از دادههایی است که فراوانی یا تعداد موارد هریک از ردههای نامتداخل را نشان میدهد. هدف، فراهم کردن نگرشی دربارهی دادههایی است که نمیتوان تنها با مشاهده دادههای اصلی به آنها دست یافت. فراوانی نسبی هر رده تابع یا احتمال تعداد کل دادههای متعلق به رده است. توزیع فراوانی نسبی خلاصه جدولی از مجموعه دادههایی است که فراونی نسبی هر رده را نشان میدهد.
درصد فراوانی هر رده حاصل ضرب فراوانی نسبی در ١٠٠ است. توزیع درصد فراوانی خلاصه جدولی مجموعه دادههایی است که درصد فراوانی نسبی را نشان میدهد. توزیعهای فراوانی تجمعی تعداد دادههای کمتر یا مساوي حد بالاي هر رده را نشان میدهد. توزیعهای فراوانی نسبی تجمعی نسبت دادههای کمتر یا مساوي حد بالاي هر رده را نشان میدهد. توزیعهای درصد فراوانی تجمعی درصد دادههای کمتر یا مساوي حد بالاي هر رده را نشان میدهد.
تفاوت دانشآموزان ریاضی با انسانی در آمار
روش تدریس ریاضی و آمار برای دانشآموزان رشتهی انسانی با دانشآموزان رشتهی ریاضیوفیزیک متفاوت است. میتوان گفت تدریس این درس برای دانشآموزان انسانی سختتر است. برای مثال اگر یکبار یک مطلب را با فرمول ریاضی به دانشآموزان ریاضی توضیح دهید آن را یاد میگیرند اما برای دانشآموزان انسانی باید تا جای ممکن از مطرح کردن فرمولهای ریاضی بر حذر باشید؛ به گونهای که با مثال شروع کنید و در نهایت فرمول را مطرح کنید؛ بنابراین باید تمام مباحث را با مثال شروع کنید. با یک مثال جامعه آماری، نمونه و تمام مباحث را از صفر توضیح دهید.
جامعهی آماری چیست
جامعهی آماری مجموعه ای از افراد، اشیا و یا جانداران که دارای صفتی مشترک باشند و شما بخواهید در مورد آن صفت، استنباطی انجام دهید. برای مثال ادعا شده است که میانگین قد دانشآموزان کلاس اول ایران نسبت به 20 سال پیش افزایش پیدا کرده است. دلایلی مانند: کاهش تعداد بعدِ خانوار و افزایش تغذیه و… موجب بلند قد شدن دانشآموزان شده است. برای بررسی کردن این فرضیه دو راه وجود دارد: روش اول، اندازهگیری قدِ تکتکِ دانشآموزان کلاس اولی و بهدستآوردن میانگین آنهاست. برای بهدست آوردن میانگین کل نیز مجموع قد دانشآموزان را تقسیم بر تعداد آنها میکنیم. به این روش سرشماری میگویند.
پارامتر و روشهای استنباطِ آن
به میانگین قد دانشآموزان کلاس اولی که درباره آن استنباط انجام میدهیم پارامتر میگویند؛ بنابراین پارامتر همان ویژگیِ جامعه است که درباره آن استنباط انجام میدهیم. اما مشکلی وجود دارد و آن هم این است که نمیتوانید همیشه سرشماری کنید. در مثال اولی که مطرح کردیم به کمک سنجش، بینایی، شنوایی، قد و وزن دانشآموزان را در اختیار داریم و این روش شدنی است.
اما اگر شما یک دانشآموز باشید و بخواهید میانگین معدّل دانشآموزان را بهدست آورید موضوعی که میخواهید درباره آن استنباط انجام دهید، میانگین معدّل دانشآموزان است. اگر بخواهید سرشماری کنید جامعه آماریْ تمام دانشآموزان ایران است. به دلیل اینکه رفتار جوامع مختلف با یکدیگر متنفاوت است باید سعی کنیم جامعه آماری خود را کوچک کنیم؛ برای مثال دانشآموزان دبیرستانی دختر شهر تبریز؛
بنابراین جامعهی آماری را با توجه به موضوع مورد نظر در نظر بگیرید. پارامتر نیز خصیصهای از جامعه است که مورد مطالعه قرار میگیرد. در این مثال پارامتر، میانگین معدّل دانشآموزان است. این روش زمان و هزینه بسیاری را صرف خواهد کرد؛ به همین دلیل در بسیاری از موارد از روش دوم استفاده میکنیم.
چگونه نمونه بگیریم
روش دوم نمونهگیری است. این موضوع که چگونه نمونه بگیریم و چند نمونه بگیریم مبحثی جدا است؛ در ضمن ما اکنون در حال مرور کردن چرخهی آمار نیز هستیم. قدم اول چرخهی آمار، بیان مسئله است؛ به این صورت که بدانید مسئله مورد نظر چیست و به دنبال چه هستید. به طور دقیق و شفاف مشخص کنید که پارامتر شما چیست و چه چیزی را میخواهید اندازهگیری کنید. پس از آن برای اینکه این پارامتر را اندازه بگیرید و درباره آن استنباط انجام دهید و چگونه و چندتا نمونه بگیرید از تکنیکهای آماری استفاده کنید. شاخصهای آماری در نمونه را آماره گویند.
Anova
به مقایسه کردن پارامترها با یکدیگر آزمون فرض آماری میگویند. برای مثال میانگین معدّل دختران و پسران را با یکدیگر و یا با یک عدد ثابتی که استاندارد میانگین معدّل است مقایسه کنید. به آزمون فرض پیشرفته تر که بیش از سه یا چهار سطر باشد تحلیل واریانس یکراهه یا Anova میگویند. پس اگر به دنبال مقایسهای میان میانگینها هستید از آزمونِ فرضِ آماری و اگر به دنبال بهدست آوردن رابطهای میان متغیرها هستید، برای مثال میان میزان مطالعه افراد و نمره کسب شدهی آنها چه رابطه ای است و یا در اقتصاد میان عرضه و تقاضا چه رابطهای است، از تکنیک ضریب همبستگی و رگرسیون استفاده میکنیم.
پس بنابر هدفی که میخواهید دنبال کنید میتوانید تکنیکهای مورد استفاده را نیز مشخص کنید. در روش دوم علاوه بر اینکه روش نمونهگیری و تعداد نمونهها را مشخص میکنیم، تعیین میکنیم که از کدام روشهای آماری میخواهیم استفاده کنیم.
انواع شاخص
شاخصهای مرکزی نشان دهندهی محوریت و مرکزیت دادهها هستند و از طرفی نشان دهندهی موقعیت و مکان هستند. برای مثال اگر معدل دانشجوی A ، 15 باشد معدل 15 نشان دهندهی این است که این دانشجو به طور متوسط در هر درس نمره 15 گرفته است و از طرفی دیگر چون نمرات بین صفر الی بیست است یعنی از نظر موقعیت و مکان این دانشجوی A در مکان 15 قرار دارد. شاخصهای پراکندگی نشان دهنده پراکندگی دادهها هستند.
برای مثال اگر دو دانشجوی A و B هر دو دارای معدل 15 باشند ولی پراکندگی نمرات دانشجوی B کمتر از پراکندگی نمرات دانشجوی A باشد آنگاه میتوان گفت که دانشجوی B وضعیت بهتری نسبت به دانشجوی A دارد. شاخصهای نسبی پراکندگی نشان دهندهی پراکندگی دادهها به طور نسبی هستند لذا آزاد از واحد اندازهگیری هستند؛ بنابراین برای مقایسهی دو جامعه که دارای واحدهای اندازهگیری متفاوت هستند و در حالاتی که دارای مقادیر شاخص مرکزی و شاخص پراکندگی متفاوت است کاربرد دارد.
هرچه مقدار شاخص نسبی پراکندگی کوچکتر باشد نشان دهندهی بهتر بودن است. بهطور غیر رسمی میتوان شاخصهای نسبی پراکندگی را به صورت نسبت شاخص پراکندگی به شاخص مرکزی تعریف نمود.
شاخصهای شکل توزیع نشان دهندهی متقارن بودن یا چولگی دادهها و کشیدگی دادهها است. اگر شکل توزیع دادهها متقارن نباشد گوئیم دارای چولگی است. بلندی شکل توزیع دادهها درصورت نرمال بودن دارای بلندی متناسب است. اگر بلندی شکل توزیع دادهها بلندتر از بلندی توزیع نرمال باشد در این صورت دارای پراکندگی کمتری است و اگر بلندی شکل توزیع دادهها کوتاهتر از بلندی توزیع نرمال باشد در این صورت دارای پراکندگی بیشتری است.
پالایشِ دادهها تا استخراجِ نتایج
پس از آن باید دادهها را جمعآوری و پالایش کنیم. بعضی از دادهها با بقیهی دادهها سازگاری ندارند؛ به این دادهها، دادههای پَرت گفته میشود که باید آنها را پالایش و از آنها صرف نظر کنیم. پس از جمعآوری و پالایش دادهها باید آنها را تجزیه و تحلیل کنیم. تجزیه و تحلیل صرفا محاسبه شاخصهاست. مرحلهی بعدی تفسیر آنها و استخراج نتایج است. پس از تکمیل شدن این مراحل، مسائل جدید طرح میشود. در مثالی که در رابطه با افت تحصیلی دانشآموزان نسبت به چند سال گذشته است، سوالات جدیدی از جمله اینکه مقدار افت تحصیلی، دلایل افت تحصیلی و… مطرح میشود.
همهچیز دربارهی جامعهی آماری
جامعه آماری بستگی به مطالعهی شما در زمینه ای خاص دارد. برای مثال اگر مطالعه درباره طول عمر لامپهای تولیدی شرکت باشد جامعه آماری، کلیه لامپهای تولیدی شرکت است. هر عضوی از جامعهی آماری را فرد یا واحد مینامیم. لامپهای تولیدی شرکت فرد یا واحد هستند. تعداد اعضای جامعه را با N نشان میدهیم. حجم جامعه و تعداد نمونهها را باn نشان میدهیم. تعداد اعضاء جامعه آماری را حجم جامعه گوییم. کمیت یا کیفیتی را که متعلق به جامعه آماری باشد را صفت مینامیم.
ممکن است در یک تحقیق چندین صفت را مورد بررسی قرار دهیم. برای مثال از شخصی گروه خونی او را میپرسیم و متوجه میشویم که A است. دوباره از همان شخص درباره قد اون سوال میپرسیم. هرکدام از اینها یک صفت است.
متغیر و انواعِ آن
صفات به دو دسته تقسیم میشوند: بعضی از صفتها برای تمام واحدهای جامعه یکسان هستند؛ برای مثال دانشجوی دانشگاه تبریز بودن؛ به این نوع صفت، صفت مشخصه میگویند. صفتی که از واحدی به واحد دیگر تغییر کند متغیر نام دارد. مانند معدّل دانشجویان که از فردی به فرد دیگر متفاوت است یا پرسشنامهای که در رابطه با نحوهی تدریس استاد نیز ارایه میشود یک متغیر است.
در علوم انسانی معمولا تحقیقاتی که انجام میشود به همراه پرسشنامه است. تکتکِ سوالاتی که در هر پرسشنامه پرسیده میشود یک متغیر است. متغیرها یا کمّی هستند یا کیفی؛ متغیرهای کمّی متغیرهایی هستند که قابل اندازهگیریاند و متغیرهای کیفی غیر قابل اندازهگیری هستند.
مقیاس ساز و انواع مقیاسها در ریاضی و آمار
به نحوهی تخصیص عدد به متغیر، مقیاسساز میگویند؛ برای مثال برای تعیین جنسیت از اعداد استفاده میکنیم. به مردانْ کُد صفر و به زنانْ کد یک میدهیم. به جای هر واحدی که مرد بود عدد صفر و به جای هر واحدی که زن بود عدد یک قرار میدهیم؛ به این روش مقیاسساز میگویند. به مقیاسی که از این طریق بدست آید، مقیاس اسمی میگویند. این مقیاس تنها برای نامیدن است و نمیتوان اَعمال ریاضی را در آن اجرا کرد، چون برتری در آن تعریف نشده است؛ یعنی میانگین جنسیت معنا ندارد، گروه خونی نیز به همین شکل است.
برای مثال اگر به گروه خونی A کد یک، به گروه خونی B کد دو، به گروه خونی AB کد سه و به گروه خونی O کد چهار بدهیم، کُد چهار بهتر از کد سه نیست و تنها برای نامیدن آنها از کد استفاده میکنیم؛ بنابراین اعمال ریاضی برای مقیاسهای اسمی مجاز نیست. یک سری متغیرها ترتیبی هستند؛ در مثال قبل، برای نحوهی تدریس استاد، به گزینهی «بسیار ضعیف» کد یک، گزینهی «ضعیف» کد دو، گزینهی «متوسط» کد سه، گزینهی «خوب» کد چهار و گزینهی «بسیار خوب» کد پنج میدهیم.
در این موضوع ما میدانیم که «بسیار خوب» بهتر از «خوب» است اما مقدار و میزان خوب بودن آن برای ما مشخص نیست و اهمیت هم ندارد.
به عبارت دیگر برای ما تنها ترتیب و برتری اهمیت دارد نه میزان برتری. به مقیاسی که تنها برتری را با استفاده از اعداد گزارش دهد، مقیاس ترتیبی میگویند. مقیاس دیگری وجود دارد که با استفاده از آن علاوه بر برتری، میزان برتری نیز مشخص میشود؛ مانند درجه حرارت. برای مثال دمای شهر تبریز 5 درجه زیر صفر و دمای شهر تهران 2 درجه بالای صفر و دمای شهر اهواز 13 درجه بالای صفر است و اگر بر حسب درجهی فارنهایت بیان کنیم فاصله اعداد با یکدیگر فرق میکند. صفر فارنهایت با صفر سلسیوس یکی نیست.
صفر سلسیوس مساوی با 32 درجهی فارنهایت و 273- درجهی کلوین است. پس یا صفر وجود ندارد یا اگر وجود داشته باشد ثابت نیست. به آنها مقیاسهای فاصلهای گفته میشود.
تشخیص مقیاسها به کمک تفاوت آنها
راه شناسایی مقیاسهای فاصلهای این است که نسبت فاصله اعداد به هم ثابت است اما نسبت خود اعداد به هم ثابت نیست؛ بهترین مثال برای مقیاسهای فاصلهای همان درجهی حرارت و یا IQ است. IQ صفر ندارد. برای مثال اگر IQ شخصی 110 و دیگری 120 باشد اختلاف ضریب هوشی این دو فرد 10 واحد است و اگر دیگری آیکیو 130 و نفر چهارم 140 باشد اختلاف ضریب هوشی این دو شخص نیز 10 واحد است. اما این دو اختلاف 10 واحدی با یکدیگر کاملا متفاوت هستند.
روشهای مختلفی برای اندازهگیریIQ وجود دارد، چون واحدهای اولین عددی که برای ضریب هوشی در این روشها وجود دارند، باهم برابر نیستند، جزو مقیاسهای فاصلهای قرار میگیرد.
مقیاسی وجود دارد که دارای تمام خاصیتهای بالا است؛ یعنی دارای ترتیب است، و نسبت فاصله اعداد به هم و نسبت خود اعداد به هم نیز ثابت است؛ به این مقیاس، مقیاس نسبتی میگویند؛ مانند قد و وزن و… . برای مثال فرض کنید تعدادی لوبیا کاشتهاید. میزان رشد همهی آنها در روز اول چه نسبت به واحد اینچ و چه سانتیمتر، صفر است. بعد از مدتی میزان رشد لوبیاها به 100 سانتیمتر میرسد و به همین ترتیب با گذر زمان به 150 سانتیمتر نیز میرسد. میزان رشد در این دو مرحله را برحسب اینچ بهدست آورید.
نسبت میزان رشد لوبیا از ابتدا تا 100 سانتیمتری نسبت به همین مقدار بر حسب اینچ برابر با نسبت میزان رشد لوبیا از 100 تا 150 سانتیمتری نسبت به همین مقدار برحسب اینچ است. به عبارت دیگر نسبتها همواره ثابت است. اما درجهی حرارت فرق میکند. برای مثال اگر آب را از دمای 50 درجه سلسیوس تا دمای 100 درجهی سلسیوس بجوشانیم، برحسب درجهی سلسیوس میزان دما 2برابر شده است اما بر حسب درجهی فارنهایت دیگر 2 برابر نیست. این تفاوت میان مقیاس نسبتی با مقیاس فاصلهای است.
پیوسته یا گسسته
به اعدادی که با مقیاس فاصلهای یا نسبتی بهدست میآیند، دادههای پیوسته و به اعدادی که از مقیاسهای اسمی و ترتیبی بدست میآیند، دادههای گسسته میگویند. نحوه برخورد با دادههای پیوسته با نحوه برخورد با دادههای گسسته کاملا متفاوت است. یعنی جداول و نمودارهایی که برای دادههای گسسته و پیوسته رسم میکنید و همچنین شاخصهایی که برای هرکدام محاسبه میکنید با یکدیگر کاملا متفاوت است.
برای مثال میزان مطالعه دانشآموزانْ یک دادهی پیوسته است؛ زیرا اگر دانشآموزی مطالعه نکرده باشد میزان مطالعه او برحسب ثانیه و دقیقه و ساعت صفر است و یا اگر نمرهی دانشآموزی صفر باشد، صفر عددی ثابت است و مقیاسی نسبتی محسوب میشود. در حالت کلی اگر صفر ثابت باشد، مقیاس نسبتی است.
تفاوت نسبتی و فاصلهای در ریاضی و آمار
اگر روشهای مختلف اندازهگیری منجر به نتایج مختلف شود مقیاس فاصلهای است؛ برای مثال اگر دو استاد سوالات یکسانی را برای آزمونِ دانشجویان انتخاب کنند اما در نحوهی تصحیح و نمره دادن متفاوت عمل کنند، مقیاس فاصلهای است. اما اگر تصحیح کردن ورقههای امتحانی یکسان باشد مقیاس نسبتی است. میان مقیاسهای نسبتی و فاصلهای بحثی نیست؛ زیرا هردوی آنها دادههای پیوسته محسوب میشوند و اهمیت آنها نیز همین است. تمام اعمالی که روی دادههای فاصلهای انجام میدهیم با تمام اعمالی که روی دادههای نسبتی انجام میدهیم یکسان هستند. در تدریس برای علوم انسانیها نیز تنها تشخیص پیوسته یا گسسته بودن مهم است.
دقیقترین دادهها
مرحله سوم جمعآوری اطلاعات است. پس از بیان مسئله و نمونهگیری نوبت به جمعآوری و پالایش دادهها است. اعدادی که به متغیر نسبت داده میشوند، مشاهده نام دارند. مجموعه اندازههایی که براي عضوهای خاص گردآوري میشوند مشاهدات نامیده میشوند. مشاهداتی که به عنوان داده در نظر میگیریم انواع متفاوتی دارند. یکی از این انواع مشاهدات به صورت دادههای ثبتی است. برای مثال تاریخ تولد و مرگ افراد ثبت میشود و یا اگر در کارگزینی ثبت نام کنید سال ورود، رتبه و… ثبت میشود. اما متاسفانه در برخی مواقع استخراج دادهها سخت است.
برای مثال برای اطلاع یافتن از تعداد تمام معلمان کشور باید از تکتکِ شهرستانها لیست اسامیآموزگاران آنها را دریافت کرد و پس از سرشماری آنها، تعداد معلمان در سطح کشور مشخص میشود که اینکار بسیار زمانبر است. در صورتی که کشور اسکاندیناوی حدود 25 سال است که سرشماری نمیکنند؛ زیرا سرشماری پرهزینه و زمانبر است. در این کشورها تمام دادهها ثبت میشوند. در جمعآوری دادهها ما باید به گونهای عمل کنیم که اشخاص اطمینان حاصل کنند که از این اطلاعات سوءاستفاده نمیشود تا پاسخ صحیح بدهند.
برای مطالعه دادهها میتوان از سیستمهای ثبتی استفاده کرد که دادههای بسیار دقیقی دارند؛ بنابراین دادههای ثبتی دقیقترین دادهها هستند.
با دادههای ثبت نشده چه کنیم
دادههایی وجود دارند که ثبت نشده اند و ما مجبور هستیم برای آنها آمارگیری کنیم. آمارگیری نیز یا به صورت سرشماری و تمام شماری و یا به صورت نمونهگیری انجام میشود. اگر وقت و هزینهی کافی داشته باشیم از سرشماری یا تمام شماری استفاده میکنیم، در غیر این صورت باید از نمونهگیری استفاده کنیم. برای مثال فرض کنید میخواهیم میزان شکنندگی لیوانهای تولیدی کارخانه را بدست آوریم. پارامتر ما میزان شکنندگی لیوانهای تولیدی کارخانه است. برای انجام اینکار باید لیوانهای تولیدی را بشکنیم.
به اینکار آزمون تخریبی میگویند. در این روش، نمونه ای مثلا 10تایی از لیوانهای تولیدی را در نظر میگیرید و با شکستن آنها میانگین میزان شکنندگی آنها را بهدست آورده و به تمامیلیوانها تعمیم میدهیم.
روشِ وارد کردنِ دادهها در ریاضی و آمار
پس از جمعآوری و پالایش کردن دادهها، باید شاخصهایی را برای آنها محاسبه کنیم. فرض کنید یک پرسشنامهای را به 30 نفر دادهایم که پر کنند. این پرسشنامه حامل سوالاتی مانند جنسیت، معدّل سال قبل، گروه خونی و… است. هر کدام از این سوالات متغیر هستند.
در صورت وارد کردن متغیرها درون نرم افزار، آنها را درون ستون قرار میدهیم به گونهای که هر متغیر یک ستون داشته باشد و هر پرسشنامه یک سطر دارد به طوری که اطلاعات هر فرد درون یک سطر قرار میگیرد. به هرکدام از این سطرها مشاهده میگویند. سپس برای هر متغیر یک عدد انتخاب میکنیم که به آن عدد مشاهده شده میگویند. تمامیاین اَعمال برای وارد کردن دادهها است.
تصادف، سیستماتیک یا طبقه
در علم آمار ما چندین روش نمونهگیری داریم؛ سادهترین روش نمونهگیری، نمونهگیری تصادفی است. به این صورت که از میان n نفر، m نفر را انتخاب میکنیم. شانس انتخاب هر عضو را میتوان از فرمول احتمال بدست آورد. دومین روش نمونهگیری، نمونهگیری سیستماتیک است. در این روش نمونهگیری با انتخاب اولین نمونه، نمونههای بعدی نیز مشخص میشوند.
روش نمونهگیری دیگری نیز به نام نمونهگیری طبقهای وجود دارد. فرض کنید میخواهید میانگین حقوق کارکنان یک شرکت بزرگ را بهدست آورید. میانگین حقوق به میزان تحصیلات افراد بستگی دارد؛ پس افراد را به دستههایی مانند زیر دیپلم، دیپلم، فوق دیپلم، لیسانس و بالاتر تقسیمبندی میکنیم.
برای مثال N، 100 هزار نفر است که 25 هزار نفر آنها زیر دیپلم، 25 هزار نفر دیپلم، 15 هزار نفر فوق دیپلم و 35 هزار نفر از آنها تحصیلات لیسانس و بالاتر دارند. حال میخواهیم از کل کارکنان نمونهی 100 تایی بگیریم. متناسب با هر کدام از ردهها تعداد نمونهها را مشخص میکنیم. این روش بسیار دقیقتر از روش نمونهگیری تصادفی است؛ زیرا اگر نمونهها را به تصادف انتخاب کنید ممکن است اکثر نمونهها از دستهی زیر دیپلم انتخاب شوند و عددی که از میانگین حقوق کارکنان بهدست میآید دقیق نیست.
اما در نمونهگیری طبقهای، نمونهها از هر طبقه متناسب با تعداد اعضای طبقه انتخاب میشوند، به همین دلیل بسیار دقیقتر است.
نمونهگیری خوشهای در برابر طبقهای
روش نمونهگیری بعدی، نمونهگیری خوشهای است. با توجه به مثال و روش قبل درون هر طبقه اختلاف میان اعضا کم است اما اختلاف میان طبقات با یکدیگر بیشتر است. اما نمونهگیری خوشهای عکس نمونهگیری طبقهای است؛ به گونهای که میان خوشهها با یکدیگر اختلاف کم و درون خوشهها اختلاف بیشتر است؛ برای مثال فرض کنید ادعا شده است تعداد داروهایی که در نسخهها در شهر تبریز نوشته میشود بسیار بالا است. برای بررسی این موضوع باید به چندین داروخانه مراجعه کرده و چند نسخه را به عنوان نمونه انتخاب کنیم یا تمامینسخههای این داروخانهها را بررسی کنیم؛ این روش نمونهگیری را نمونهگیری خوشهای مینامیم.
نمونهگیری خوشهای، محبوبتر از همه
نمونهگیری خوشهای خود نیز به چند دسته ی نمونهگیری خوشهای یک مرحلهای، دو مرحلهای، سه مرحلهای و… تقسیم میشود. در نمونهگیری خوشهای یک مرحلهای فرض کنید 100 داروخانه وجود دارد که 5 تا از آنها را انتخاب میکنیم و تمام نسخ این 5 داروخانه را بررسی میکنیم. اما اگر تعداد داروخانههای مورد بررسی را بیشتر کنیم و تعداد نسخ آنها را محدود کنیم از نمونهگیری خوشهای دو مرحلهای استفاده کردهایم. اکثر نمونهگیریهایی که مرکز آمار انجام میدهد، نمونهگیری خوشهای است زیرا شهرستانها با یکدیگر هم خوشه هستند. درون شهرستان شهر و درون شهر خانوار وجود دارد که هر خانوار یک خوشه است.
مورگان و جداول مربوط به آن در ریاضی و آمار
در نمونهگیری تصادفی فرمولی برای تعداد نمونهها داریم، به گونهای که اگر اندازه جامعه معلوم باشد از فرمول خاصّ خودش و اگر اندازه جامعه معلوم نباشد نیز از فرمول دیگری استفاده میکنیم. در آمار و ریاضیِ علوم انسانی جداولی به نام جداول مورگان وجود دارد به این صورت که اگر اندازه جامعه 300 بود نمونه 40 تایی کافی است و اگر اندازه جامعه200 بود نمونه 35 تایی کافی است.
معمولا در رشتهی علومانسانی نمونهگیریهای خود را بر اساس جداول مورگان انجام میدهند. در جدول مورگان اندازهی نمونه به واریانس پارامتری و دقت پارامتری بستگی دارد به طوری که اگر پارامترِ میانگین باشد اندازهی نمونه با پارامترِ نسبت فرق میکند؛ برای مثال در پارامتر نسبت میخواهیم نرخ بیکاری شهر تبریز را بهدست آوریم به همین دلیل باید نمونهی بزرگتری را انتخاب کنیم در صورتی که تعداد نمونه در پارامتر میانگین کم است.
بررسی یا تحقیق آماری
بررسی است که موضوع مورد مطالعه را به یك جامعه مربوط میکند و در آن جامعه افراد را مورد مطالعه قرار میدهد. برای مثال میخواهیم مقدار مصرف گاز در منطقه ای را مطالعه کنیم، یعنی میخواهیم مصرف گاز را به آن منطقه مربوط کنیم.
مراحل بررسی یا تحقیق آماری:
- عنوان
- تعیین صفات مورد بررسی
- جمع آوری اطلاعات ( مشاهده )
- گروه بندی، جدول بندی و رسم نمودار
- محاسبه شاخصهای آماری
- مدل آماری مناسب را به دادهها برازش میدهیم
- آیا مدل آماری برازنده دادهها میباشد؟
کاربرد علم آمار در تجارت و اقتصاد
- حسابداري
شرکتهای دولتی حسابداري طرز کار نمونههای آماري را زمانی که اداره براي مراجعین حسابرسی میکند، بکار میبرند.
- تامین بودجه
تحلیلگر مالی نوعی از اطلاعات آماري، شامل سهمیه ارزش درآمد و سود سهم را براي سرمایه گذاري پیشنهاد میکند.
- بازار یابی
نتیجهی فروش الکترونیکی پویشگرها در پیشخوان فروشگاه صندوق براي وصول مقادیر براي یک نوع درخواست پژوهش بازاریابی بکار برده میشود.
- تولید
یک نوع جدول کنترل کیفیت آماري براي خروجی دستگاه کنترل از یک فرآیند تولید بکار برده میشود.
- اقتصاد
دیدگاهتان را بنویسید