مهندسی مخزن کاربردی (۳): مفهوم پارامترهای P10 و P50 و P90 در تخمین ذخیره
اگر پست قبلی (این لینک) را مطالعه کرده باشید، ممکن است سوالی برای شما پیش آمده باشد که پارامترهای P10 و P50 و P90 چه هستند؟ چرا این پارامترها در تخمین ذخیره اهمیت دارند؟
مقدار زیاد دادههای تولید شده توسط روشهای آماری گاهی اوقات استفاده موثر از نتایج آنها را دشوار میسازد. برای مثال در روش شبیهسازی مونت کارلو، این روش مبتنی بر شبیهسازی سناریوهای احتمالی است.
P10 و P50 و P90 پارامترهای مفیدی برای درک نحوه توزیع اعداد در یک نمونه (sample) هستند. با یک مثال توضیح خواهم داد.
نمونه زیر را در نظر بگیرید (فهرست مشاهدات). آنها میتوانند هر چیزی مثل پرتقال، موز، بهرهوری تولید و غیره را نمایش دهند.
- ۹۵
- ۹۵
- ۹۶
- ۹۵
- ۹۷
- ۹۳
- ۹۴
- ۹۵
- ۹۶
- ۹۴
چندین گزینه برای نمایش این دادهها وجود دارد. شما میتوانید مشاهدات را در محدوده مشخصی گروهبندی کنید و یک frequency table (جدولی که نشان میدهد چند مرتبه یک مشاهده (observation) در نمونه ظاهر میشود) ایجاد کنید.
توزیع نرمال یا منحنی زنگی (Bell curve)
با این توزیع، نیازی به دسترسی به تمام data point های نمونه برای شروع تحلیل وجود ندارد. ما میتوانیم با نگاه کردن به نمودار متوجه شویم که اکثر مشاهدات در حدود ۹۵ هستند.
فرکانس تجمعی (Cumulative Frequency) و احتمال وقوع بیش از حد (Probability of exceedance) چیست؟
یکی دیگر از گزینههای نمایش این توزیع، استفاده از یک نمودار “فرکانس تجمعی” است. این جدول با اضافه کردن هر فرکانس از یک جدول توزیع فرکانس به مجموع پیشینیانش محاسبه میشود.
اگر از سمت چپ شروع کنید (یعنی مقادیر مشاهده کمتر) و به سمت راست منحنی زنگی (یعنی مقادیر مشاهده بالاتر) حرکت کنید، شما در حال ساخت یک منحنی Probability of exceedance هستید.
نمودار توزیع فرکانس تجمعی برای داده هایی گفته شده در بالا به صورت زیر خواهد بود:
با توجه به جدول و نمودار بالا، ۳۰ درصد از مشاهدات ما برابر یا بیشتر از ۹۶ خواهد بود. این چیزی است که به آن Probability of exceedance میگویند.
پارامترهای P10 و P50 و P90 چه هستند؟
در P10 و P50 و P90، حرف P مخفف Percentile (صدک) است. مقدار محاسبه شده به نوع توزیع انتخاب شده بستگی دارد. به عنوان مثال، اگر ما تصمیم بگیریم که از منحنی Probability of exceedance استفاده کنیم، وقتی میگوییم یک توزیع دارای P10 of X است، منظورمان این است که “در این توزیع، ۱۰ درصد مشاهدات برابر یا بیشتر از مقدار X خواهند کرد”. بنابراین در مثال ما:
P10 = 97
P50 = 95
P90 = 94
نکته: توجه داشته باشید که وقتی میگوییم P90، این بدان معنا نیست که یک تخمین ۹۰ درصد شانس رخداد دارد.
به طور خلاصه:
برای مثال، اگر زمینشناسان تخمین بزنند که ۹۰ درصد شانس وجود دارد که یک میدان نفتی حاوی ۵۰ میلیون بشکه است و تخمین دیگر بگوید که ۱۰ درصد شانس تولید ۲۰ میلیون بشکه دیگر علاوه بر ۵۰ میلیون بشکه قبلی وجود دارد؛ بنابراین ما میتوانیم به موارد زیر اشاره کنیم:
بهترین تخمین چیست؟
بحثهای بسیاری در در مورد بهترین تخمین وجود دارد. P90؟ یا P10؟ یا P50؟
جواب: بسیاری از متخصصان بر روی P50 اتفاق نظر دارند.
نکته: اگر منحنی توزیع به صورت متقارن باشد:
mode = mean = P50
دیدگاهتان را بنویسید