PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : توزیع آماری داده ها



HSCD
2014/03/28, 20:36
سلام

همونطوری که توی شکل هم میبینید مقدار زیادی از داده ها در اون دوتا محدوده توزیع شده جوری که یه درصد زیادی از کل داده ها رو شامل میشه.

بطور کلی چطور میشه فهمید که در یک توزیع تصادفی داده ها در یک بازه؛ اکثر اونا حول چه مقداری متمرکز شده؟

اگه مثل شکل زیر دو یا چند تا از این نواحی وجود داشت چطور میشه فهمید حدودا چند درصد از کل داده ها در هر یک از اون نواحی پخش شده و مرکز هر یک از اون نواحی که داده ها حول اون توزیع شدن چه عددیه؟

من داده ها رو توى اکسل بطور خام دارم. اون چيزيايى که ميخوام رو چطورى ميتونم توى اکسل حساب کنم؟

بطور مثال میخوام نتیجه اینجوری باشه: %26 داده های حول عدد 1800 با انحراف معیاد 95 هستند و %19 داده ها حول عدد 535 با انحراف معیار 36 هستند.

2801

Ali Parsaei
2014/03/29, 00:26
سلام،
سوال شما در حيطه عمليات آماري است و قاعدتا" دوستاني که آمار خوانده اند و با اکسل هم آشنايي دارند بايد جواب دهند.
فقط من جسارتا" عرض کنم که اگر شما خودتان به علم آمار وارد هستيد و فقط با اکسل آشنا نيستيد، در اين صورت يک کم راهنمايي کنيد که در حالت عادي با استفاده از چه توابع و راهکارهايي اين عمليات انجام مي گردد؟ آيا اين کار عمليات معمولي است و اصطلاح خاص خود را دارد؟ در اين صورت شايد بقيه دوستاني که به آمار وارد نيستند هم بتوانند کمکتان کنند.
ببينيد ... اکسل توابع بسيار زيادي در زمينه آمار دارد، مانند average براي محاسبه ميانگين حسابي، betadist براي محاسبه توزيع تجمعي بتا، frequency براي محاسبه فراواني گروه هاي تعيين شده، mode براي محاسبه مقداري که بيشترين فراواني را دارد، percentile براي محاسبه n امين صدک در محدوده تعيين شده، rank جهت تعيين جايگاه يک عدد در ميان مجموعه اي از داده ها، stdev براي محاسبه انحراف معيار استاندارد بر اساس نمونه اي از کل جمعيت آماري و stdevp و .... ده ها تابع ديگر
شايد يک تابع خاص باشد که دقيقا" کار مورد نظر شما را انجام دهد،
البته اميدوارم دوستاني که به آمار واردند جسارت بنده را در ورود به موضوع فوق ببخشند.

HSCD
2014/03/29, 17:37
سلام
شغل من ربط زیادی به آمار نداره. حین انجام یه کاری به این موضوع برخوردم و همونجای کار گیر کردم.
به هر حال من منتظر یه راه حل هستم البته باید بعد از تعطیلات کار رو تحویل بدم.
ممنون از کمک شما

khakzad
2014/03/29, 19:39
سلام
فکر می کنم با سعی و خطا باید این کا ررو انجام بدیم.......... (البته نمیدونم حساسیت به دقت محاسبات چقدر هست)
اما به نظرم اول از طریق همین نمودار، یک عدد تقریبی بدست بیارید، بعد دامنه رو براش تعیین کنید(شعاع مورد نظر)........بعد با ترکیب فرمول ها می شه درصد ها و . . . مشخص کرد
در نهایت میشه با فیلتر، صحت تخمین ها رو سنجید.
اگر امکانش هست، فایل رو بذارید، تا روش کار بشه.......شاید در حین کار، راه های بهتری به پیشنهاد بشه.

~M*E*H*D*I~
2014/03/29, 20:07
با درود

البته دوستان بیشتر و بهتر از من با مباحث اماری آشنا هستند و بنده مدت هاست از فضای درس و دانشگاه فاصله گرفتم اما طبق اطلاعات ناقصم این موردی که شما مطرح کردید در امار به کلاسترینگ یا خوشه بندی معروف هست البته باید ذکر کنم تعداد خوشه ها یک پارامتر ورودی هست یعنی شما تعیین می کنید که داده ها به چند طبقه تقسیم بشن هرچه تعدا طبقات بالاتر باشه دقت بالاتر خواهد بود اگر این مورد مشکل شمارو حل میکنه بفرمایید تا راهکارهایی ارائه بشه

HSCD
2014/03/29, 23:59
با درود

البته دوستان بیشتر و بهتر از من با مباحث اماری آشنا هستند و بنده مدت هاست از فضای درس و دانشگاه فاصله گرفتم اما طبق اطلاعات ناقصم این موردی که شما مطرح کردید در امار به کلاسترینگ یا خوشه بندی معروف هست البته باید ذکر کنم تعداد خوشه ها یک پارامتر ورودی هست یعنی شما تعیین می کنید که داده ها به چند طبقه تقسیم بشن هرچه تعدا طبقات بالاتر باشه دقت بالاتر خواهد بود اگر این مورد مشکل شمارو حل میکنه بفرمایید تا راهکارهایی ارائه بشه


اتفاقا یکی دیگه از همکارا هم منو به همین کلاسترینگ ارجاع داد ولی چون من اطلاعاتی در موردش نداشتم دنبالشو نگرفتم. شاید واقعا راه حل همین باشه ولی من فکر میکردم بین توزیع های آماری باید بشه یه حالتی رو برای یه همچین وضعیتی پیدا کرد. نمودار توزیع نرمال رو یادتون هست اون یه پیک داشت این دوتا داره فکر نمیکردم چیز عجیب غریبی باشه
در مورد فایل هم اون فقط یه عالمه دیتای خامه اگه بدردتون میخوره بفرستمش.

~M*E*H*D*I~
2014/03/30, 07:48
اتفاقا یکی دیگه از همکارا هم منو به همین کلاسترینگ ارجاع داد ولی چون من اطلاعاتی در موردش نداشتم دنبالشو نگرفتم. شاید واقعا راه حل همین باشه ولی من فکر میکردم بین توزیع های آماری باید بشه یه حالتی رو برای یه همچین وضعیتی پیدا کرد. نمودار توزیع نرمال رو یادتون هست اون یه پیک داشت این دوتا داره فکر نمیکردم چیز عجیب غریبی باشه
در مورد فایل هم اون فقط یه عالمه دیتای خامه اگه بدردتون میخوره بفرستمش.

بنده از یک متخصص آمار هم سوال کردم راه حل K - means clustering هست در SPSS از طریق Analyze/Classify گزینه K means cluster قابل اجراست در اکسل هم اگر راه حلی پیدا کردم مطرح می کنم

khakzad
2014/03/30, 11:39
از راه حل های غیر اکسلی، نرم افزار clementine هم وجود داره که ویژه داده کاوی هست و الگوریتم K means اوونجا هم هست که مربوط به خوشه بندی هست.....

این رو هم می تونید امتحان کنید
الگوریتم C5 هم هست که اونم واسه خوشه بندی هست....... ببینید کدوم مناسب داده ها هستن
چند تا الگوریتم خوشه بندی دیگه وجود داره......که بسته به نوع داده هاست.....
فکر کنم با SPSS انجام بدین و با CLEMENTINE تست کنید ببینید چقدر مشابه هستن و کدوم مناسب تره، بهتر باشه
موق باشید

HSCD
2014/03/30, 20:23
بنده از یک متخصص آمار هم سوال کردم راه حل K - means clustering هست در SPSS از طریق Analyze/Classify گزینه K means cluster قابل اجراست در اکسل هم اگر راه حلی پیدا کردم مطرح می کنم


از راه حل های غیر اکسلی، نرم افزار clementine هم وجود داره که ویژه داده کاوی هست و الگوریتم K means اوونجا هم هست که مربوط به خوشه بندی هست.....

این رو هم می تونید امتحان کنید
الگوریتم C5 هم هست که اونم واسه خوشه بندی هست....... ببینید کدوم مناسب داده ها هستن
چند تا الگوریتم خوشه بندی دیگه وجود داره......که بسته به نوع داده هاست.....
فکر کنم با SPSS انجام بدین و با CLEMENTINE تست کنید ببینید چقدر مشابه هستن و کدوم مناسب تره، بهتر باشه
موق باشید

ممنون از راهنمایی های اساتید.
چک میکنم نتیجه رو اطلاع میدم.
متشکرم

امين اسماعيلي
2014/03/31, 03:51
با درود
من نمیدونم دقیق داده هاتون منظورم همون X و y ها داره به نقاط تبدیل میشن . بعد ها چی هستند. اما خوب با نمودار histogram و رسم نمودار توی یه محدوده های مختلف میشه نمودار تجمعی رو رسم کرد و بعد درصد رو تو هر بخش محاسبه کرد . اما مطمئنن دوستان در بالا راهکار های حرفه ای تری رو ارائه دادن. امیدوارم مشکلتون با موارد بالا حل بشه ( برای استفاده از Histogram باید ‘Analysis ToolPack نصب باشه)