بلاگ

مهندسی مخزن کاربردی (۳): مفهوم پارامترهای P10 و P50 و P90 در تخمین ذخیره

اگر پست قبلی (این لینک) را مطالعه کرده باشید، ممکن است سوالی برای شما پیش آمده باشد که پارامترهای P10 و P50 و P90  چه هستند؟ چرا این پارامترها در تخمین ذخیره اهمیت دارند؟

مقدار زیاد داده‌های تولید شده توسط روش‌های آماری گاهی اوقات استفاده موثر از نتایج آنها را دشوار می‌سازد. برای مثال در روش شبیه‌سازی مونت کارلو، این روش مبتنی بر شبیه‌سازی سناریوهای احتمالی است.

P10 و P50 و P90 پارامترهای مفیدی برای درک نحوه توزیع اعداد در یک نمونه (sample) هستند. با یک مثال توضیح خواهم داد.

نمونه زیر را در نظر بگیرید (فهرست مشاهدات). آن‌ها می‌توانند هر چیزی مثل پرتقال، موز، بهره‌وری تولید و غیره را نمایش دهند.

  1. ۹۵
  2. ۹۵
  3. ۹۶
  4. ۹۵
  5. ۹۷
  6. ۹۳
  7. ۹۴
  8. ۹۵
  9. ۹۶
  10. ۹۴

چندین گزینه برای نمایش این داده‌ها وجود دارد. شما می‌توانید مشاهدات را در محدوده مشخصی گروه‌بندی کنید و یک frequency table (جدولی که نشان می‌دهد چند مرتبه یک مشاهده (observation) در نمونه ظاهر می‌شود) ایجاد کنید.

توزیع نرمال یا منحنی زنگی (Bell curve)

با این توزیع، نیازی به دسترسی به تمام data point های نمونه برای شروع تحلیل وجود ندارد. ما می‌توانیم با نگاه کردن به نمودار متوجه شویم که اکثر مشاهدات در حدود ۹۵ هستند.

فرکانس تجمعی (Cumulative Frequency) و احتمال وقوع بیش از حد (Probability of exceedance) چیست؟

یکی دیگر از گزینه‌های نمایش این توزیع، استفاده از یک نمودار “فرکانس تجمعی” است. این جدول با اضافه کردن هر فرکانس از یک جدول توزیع فرکانس به مجموع پیشینیانش محاسبه می‌شود.

اگر از سمت چپ شروع کنید (یعنی مقادیر مشاهده کمتر) و به سمت راست منحنی زنگی (یعنی مقادیر مشاهده بالاتر) حرکت کنید، شما در حال ساخت یک منحنی Probability of exceedance هستید.


نمودار توزیع فرکانس تجمعی برای داده هایی گفته شده در بالا به صورت زیر خواهد بود:

 

با توجه به جدول و نمودار بالا، ۳۰ درصد از مشاهدات ما برابر یا بیشتر از ۹۶ خواهد بود. این چیزی است که به آن Probability of exceedance می‌گویند.

پارامترهای P10 و P50 و P90  چه هستند؟

در P10 و P50 و P90، حرف P مخفف Percentile (صدک) است. مقدار محاسبه شده به نوع توزیع انتخاب شده بستگی دارد. به عنوان مثال، اگر ما تصمیم بگیریم که از منحنی Probability of exceedance استفاده کنیم، وقتی می‌گوییم یک توزیع دارای P10 of X است، منظورمان این است که “در این توزیع، ۱۰ درصد مشاهدات برابر یا بیشتر از مقدار X خواهند کرد”. بنابراین در مثال ما:

P10 = 97

P50 = 95

P90 = 94

نکته: توجه داشته باشید که وقتی می‌گوییم P90، این بدان معنا نیست که یک تخمین ۹۰ درصد شانس رخداد دارد.

به طور خلاصه:

برای مثال، اگر زمین‌شناسان تخمین بزنند که ۹۰ درصد شانس وجود دارد که یک میدان نفتی حاوی ۵۰ میلیون بشکه است و تخمین دیگر بگوید که ۱۰ درصد شانس تولید ۲۰ میلیون بشکه دیگر علاوه بر ۵۰ میلیون بشکه قبلی وجود دارد؛ بنابراین ما می‌توانیم به موارد زیر اشاره کنیم:

بهترین تخمین چیست؟

بحث‌های بسیاری در در مورد بهترین تخمین وجود دارد. P90؟ یا P10؟ یا P50؟

جواب: بسیاری از متخصصان بر روی P50 اتفاق نظر دارند.

نکته: اگر منحنی توزیع به صورت متقارن باشد:

mode = mean = P50

منبع

 

 
 
 
 
 
 
 
 
 
 
 
 
 
 

دیدگاهتان را بنویسید