بلاگ

چگونه خود را برای موج بعدی (راه‌ حل‌های مبتنی بر علم داده) آماده کنید؟ (بخش اول)

علم داده در مهندسی نفت

با فراگیر شدن استفاده از علم داده در صنعت نفت و گاز، سوالی که مطرح می‌شود این است که چگونه می‌توانیم خودمان را برای این موج جدید آماده کنیم؟ چگونه متخصصان جوان می‌توانند خود را برای کاربرد علم داده در کارشان و نحوه برخورد با مشکلات و چالش‌ها آماده کنند؟

دکتر Satyam Priyadarshy که هم اکنون به عنوان دانشمند ارشد داده در شرکت هالیبرتون کار می‌کند و او را به عنوان اولین دانشمند ارشد داده در صنعت نفت و گاز می‌شناسند، جوایز بسیاری را از صنعت دریافت کرده است و یکی از پرطرفدارترین سخنرانان دعوت شده در حوزه‌های فناوری‌های نوظهور، مکانیک کوانتومی، امنیت سایبری و بلاک چین، بیگ دیتا، تحول دیجیتال و غیره است.

ترجمه جدیدترین مصاحبه او را در ادامه آورده‌ام که می‌توانید نهایت استفاده را ببرید.

مصاحبه کننده: همه ما می‌دانیم که به اندازه کافی خوش‌شانس هستیم که در دوران عالی زندگی می‌کنیم که در آن اطلاعات و دانش بسیار در دسترس ما است. همچنین شاهد تحول در صنعت انرژی، به ویژه دیجیتالی شدن، هستیم. آقای دکتر ساتیام، چه منابعی را به متخصصان جوان پیشنهاد می‌کنید تا با روندهای هوش مصنوعی و پیشرفت‌های علم داده همراه شوند؟

دکتر ساتیام: اول از همه، افرادی که در حال حاضر در صنعت هستند یا می‌خواهند وارد شوند، مقالات SPE را بخوانند. بدین صورت شما با کارهای انجام شده و دلیل موفقیت یا عدم موفقیت آنها آشنا می‌شوید. نفت و گاز یک صنعت مبتنی بر علم و مهندسی است. به دو موضوع بسیار مهم “یکپارچه‌سازی داده‌ها” و “شناخت دقیق کاربرد الگوریتم‌ها” به تسلط برسید. شما باید بتوانید چندین مجموعه داده را صورت یکپارچه به هم متصل کنید. آیا واقعاً باید پیچیده‌ترین الگوریتم را برای یک مسئله اعمال کنیم؟ آیا این صحیح است که من یک مقاله در مورد یادگیری عمیق بخوانم و بعد بیاییم آن را در شبیه‌سازی مخزن اعمال کنم؟!

بنابراین:

۱) مقالات SPE (شامل همه انجمن‌ها علاوه بر SPE مانند SEG، AAPG و غیره). JPT یک خلاصه خوب و جمع و جور از مقالات ماهانه انجام می‌دهد که مقالات مروری خوبی دارد. OnePetro، یک منبع آنلاین از مقالات فنی است و دسترسی به بیش از ۲۰۰۰۰۰ مقاله را فراهم می‌کند.

۲) مجموعه دوم مقالاتی که می‌توانید بخوانید IEEE – Institute of Electrical and Electronics Engineers است. طیف وسیع‌تری از کاربردهای یک الگوریتم خاص برای یک مسئله بهینه‌سازی یا یک راه حل ابتکاری برای یک مسئله پیچیده را در اختیار شما قرار می‌دهد.

مصاحبه کننده: معمولاً برای متخصصان جوان، علم داده گاهی اوقات به عنوان سنگ روزتا (سنگ‌نوشته‌ای از دوران مصر باستان) تلقی می‌شود. این چیزی است که می‌تواند همه مشکلاتی را که ما داریم حل کند. فقط از علم داده یا تکنیک‌های یادگیری ماشین استفاده کنید و همه چیز درست می‌شود! توصیه شما به متخصصان جوان در مورد تکنیک‌های مختلف علم داده چیست و در هنگام استفاده یا به کارگیری هر یک از این تکنیک‌ها باید از چه رویکردهایی استفاده کنند؟

دکتر ساتیام: علم داده برابر است با “علم روی داده” (science on the data). همه ما نمی‌توانیم در همه چیز متخصص باشیم. به عنوان مثال، برخی از افراد ممکن است در بررسی خود داده‌ها بسیار خوب باشند. مثلاً چگونه می‌توانم داده‌ها را جمع‌آوری کنم و واقعاً چگونه آن را به شکل و فرم درآورم تا بتوانم برخی از برنامه‌ها یا الگوریتم‌ها را بر روی آن اجرا کنم؟ دیگران ممکن است بگویند اجازه دهید بریم مدل‌های خود را بر روی آن بسازیم. و سپس برخی از افراد ممکن است عاشق استفاده از یک یا دو مدل باشند زیرا در آن بسیار متخصص هستند. اما افراد دیگر ممکن است بخواهند بیش از یک مدل یا صدها مدل را کشف کنند و تمام عمر خود را صرف آن کنند. بنابراین، استعدادهای متفاوتی وجود دارد.

و البته، تشخیص الگوی موجود در داده‌ها سخت‌ترین بخش است. زیرا شما می‌توانید چیزی را ببینید (در نمودارها)، اما نمی‌توانید تفسیر کنید. و این مهارتی است که همه ما واقعاً باید در این صنعت بدانیم. این تنها با خواندن کتاب بدست نمی‌آید؛ با تمرین و بحث با متخصصان آن حوزه. زمانی که یاد گرفتید این الگوها را تفسیر کنید، زمانی است که در واقع شروع به تبدیل مشکل به راه حل و گفتن یک داستان می‌کنید. این نحوه رسیدگی به یک مشکل است.

یکی از گیج‌کننده‌ترین چیزهایی که در صنعت ما خواهید شنید این است که همه مشتاق دقت مدل هستند. این دقت به چه معناست؟ آیا من یک مدل ۱۰۰٪ دقیق می‌خواهم که سال‌ها برای ساخت آن وقت بگذارم؟ یک اپراتور را در نظر بگیرید، با ۱۰۰ پمپ در حال کار و به طور معمول، مثلاً، ۵۰٪ از پمپ‌ها هر سال از کار می‌افتند. حال، فرض می‌کنیم که شما تمام داده‌ها را برای تمام ۵۰ درصد آن خرابی‌ها (failure) در چندین سال گذشته در اختیار دارید و شما الگوریتم‌های بسیار خوبی برای پیش‌بینی خرابی بر اساس آنچه دارید می‌سازید. اما دقت شما فقط مثلاً ۶۰ درصد است. آیا آن راه‌حل را اجرا می‌کنید یا صبر می‌کنید و به بهبود ادامه می‌دهید تا زمانی که به ۱۰۰% برسید؟ اگر مدل من ۶۰ درصد در پیش‌بینی خرابی‌ها دقت داشته باشد، به این معنی است که از ۵۰ مورد، حداقل می‌توانیم ۳۰ خرابی را پیش‌بینی کنیم. اگر به دنبال ۱۰۰% هستید، به این معنی است که ما باید تمام ۵۰ خرابی را پیش‌بینی کنیم. حالا اگر بتوانم از آن ۳۰ خرابی جلوگیری کنم، آیا ارزشی ایجاد نکرده‌ام؟ بنابراین، ما باید به علم داده از نظر تولید ارزش نگاه کنیم، نه دقت.

من همیشه می‌گویم که باید علم داده را مرحله به مرحله انجام دهید. چگونه می‌توانم کیفیت یا کمیت داده‌های خود را در آینده بهبود بخشم؟ ما نمی‌توانیم گذشته را تغییر دهیم، اما می‌توانیم آینده را تغییر دهیم. در واقع من می‌گویم بیایید سنسورهای بیشتری قرار دهیم یا داده‌ها را با فرکانس بالاتر جمع‌آوری کنیم.

به یاد داشته باشید، یکی از چیزهایی که من همیشه می‌گویم: شما می‌توانید به مشکلات علم داده از سه طریق فکر کنید:

  1. چیزی را با استفاده از آن بهینه‌سازی کنید: در صنعت ما، تقریباً در همه چیز، از یک گردش کار (workflow) ساده گرفته تا یک گردش کار بسیار پیچیده، می‌توان بسیاری از بهینه‌سازی‌ها را انجام داد. وقتی می‌گویید گردش کار را بهینه کنید، به این معنی است که در واقع داده‌ها را نیز بهینه می‌کنید زیرا گردش کار روی داده‌ها کار می‌کند.
  2. خودکارسازی فرایندها: الگوریتمی بنویسید که اجرا شود، بینش‌هایی را که می‌خواهیم به ما ارائه دهد، یک طرح‌بندی زیبا و راه‌حلی برای مشکل مورد نظر به ما ارائه دهد. اتوماسیون به این معنی است که شما باید به بخش پیش‌بینی بپردازید و کمی از بخش تجویزی را نیز در آن بررسی کنید.
  3. یا ساخت یک راه حل کاملا نوآورانه (نوآوری)

 

ادامه این نوشته را از اینجا بخوانید.

دیدگاهتان را بنویسید