حذف داده های پرت در اکسل

Collapse
این تاپیک قفل است.
X
X
 
  • زمان
  • نمایش
حذف همه
new posts
  • Ani_Goli

    • 2016/01/01
    • 9

    [حل شده] حذف داده های پرت در اکسل

    مجموعه داده ای با 1200 سطر دارم که می خواهم داده های پرت (outlier) را از آن حدف کنم. آیا با توابع اکسل می توان این کار را کرد؟
    تابع trimmean به دردم نمی خ.رد. جایی خواندم تابع TRIMDATA دقیقا کاری که می خواهم انجام میدهد، اما در اکسل 2010 که دارم وجود ندارد، کسی اگر در این زمینه تجربه ای داشته ممنون میشم راهنمایی کند.
    Last edited by Ani_Goli; 2016/01/14, 22:34.
  • Ani_Goli

    • 2016/01/01
    • 9

    #2
    نوشته اصلی توسط Ani_Goli
    مجموعه داده ای با 1200 سطر دارم که می خواهم داده های پرت (outlier) را از آن حدف کنم. آیا با توابع اکسل می توان این کار را کرد؟
    تابع trimmean به دردم نمی خ.رد. جایی خواندم تابع TRIMDATA دقیقا کاری که می خواهم انجام میدهد، اما در اکسل 2010 که دارم وجود ندارد، کسی اگر در این زمینه تجربه ای داشته ممنون میشم راهنمایی کند.
    مساله رو حل کردم. البته قسمتی با توابع موجود و قسمنی را با فرمول نویسی حل کردم.

    ابتدا باید داده ها را به صورت صعودی مرتب و چارک اول و سوم (Quartile 1,3) را بدست اورد
    سپس inter quartile range را باید محاسبه کرد ک میشه فاصله چارک سوم از چارک اول
    پس از ان حد بالا و پایین را برای داده ها تعریف می کنیم
    اکنون با مقایسه هر داده با این حدود تعربف شده، می تواان تعیین کرد که آن داده پرت (outlier) است یا نه

    روش انجام مراحل بالا با اکسل:
    استفاده از تابع چارک: Quartile(A2:A1200,1 پارامتر اول رنج داده های ستون اول است و پارامتر دوم یعنی چارک اول را حساب کن
    به همین ترتیب برای quartile سوم داریم:Quartile(A2:A1200,3
    **نکته: چون در اکسل ک از تابع quartile استفاده می کنیم دیگه نیازی نیس قبلش داده ها را مرتب کنیم.
    محاسبه inter quartile range:
    IQR=Q3-Q1
    حد بالا:
    UP= Q3+(1.5*IQR
    حد پایین:
    LB=Q1-(1.5*IQR
    ** توجه: برای بدست اوردن داده های پرت ضعیف، عدد 1.5 را در IQR ضرب می کنیم و برای بدست اوردن داده های پرت قوی، عدد 3 را در IQR ضرب می کنیم. بنابراین بسته ب استفاده خود می توانید فرمول حد بالا و پایین را تغییر دهید.
    اکنون هر داده اگر مقدارش از حدبالا، بیشتر بود یا از حد پایین کمتر بود، داده پرت ب حساب می اید. پس جلوی هر داده می توان با نوشتن فرمول زیر معلوم کرد که داده پرت است یا خیر:
    OR(A2>UB,A2<LB=


    مقدار این فرمول برابر با true یا false است که مقدار true به معنی این است که ان داده outlier می باشد.
    در اخر کار می توان با روش های مختلف این داده های پرت را حذف کرد. مثلا یک راه اینه ک trueها را فیلتر کنیم.

    کامنت

    چند لحظه..