چگونه خود را برای موج بعدی (راه حلهای مبتنی بر علم داده) آماده کنید؟ (بخش اول)
با فراگیر شدن استفاده از علم داده در صنعت نفت و گاز، سوالی که مطرح میشود این است که چگونه میتوانیم خودمان را برای این موج جدید آماده کنیم؟ چگونه متخصصان جوان میتوانند خود را برای کاربرد علم داده در کارشان و نحوه برخورد با مشکلات و چالشها آماده کنند؟
دکتر Satyam Priyadarshy که هم اکنون به عنوان دانشمند ارشد داده در شرکت هالیبرتون کار میکند و او را به عنوان اولین دانشمند ارشد داده در صنعت نفت و گاز میشناسند، جوایز بسیاری را از صنعت دریافت کرده است و یکی از پرطرفدارترین سخنرانان دعوت شده در حوزههای فناوریهای نوظهور، مکانیک کوانتومی، امنیت سایبری و بلاک چین، بیگ دیتا، تحول دیجیتال و غیره است.
ترجمه جدیدترین مصاحبه او را در ادامه آوردهام که میتوانید نهایت استفاده را ببرید.
مصاحبه کننده: همه ما میدانیم که به اندازه کافی خوششانس هستیم که در دوران عالی زندگی میکنیم که در آن اطلاعات و دانش بسیار در دسترس ما است. همچنین شاهد تحول در صنعت انرژی، به ویژه دیجیتالی شدن، هستیم. آقای دکتر ساتیام، چه منابعی را به متخصصان جوان پیشنهاد میکنید تا با روندهای هوش مصنوعی و پیشرفتهای علم داده همراه شوند؟
دکتر ساتیام: اول از همه، افرادی که در حال حاضر در صنعت هستند یا میخواهند وارد شوند، مقالات SPE را بخوانند. بدین صورت شما با کارهای انجام شده و دلیل موفقیت یا عدم موفقیت آنها آشنا میشوید. نفت و گاز یک صنعت مبتنی بر علم و مهندسی است. به دو موضوع بسیار مهم “یکپارچهسازی دادهها” و “شناخت دقیق کاربرد الگوریتمها” به تسلط برسید. شما باید بتوانید چندین مجموعه داده را صورت یکپارچه به هم متصل کنید. آیا واقعاً باید پیچیدهترین الگوریتم را برای یک مسئله اعمال کنیم؟ آیا این صحیح است که من یک مقاله در مورد یادگیری عمیق بخوانم و بعد بیاییم آن را در شبیهسازی مخزن اعمال کنم؟!
بنابراین:
۱) مقالات SPE (شامل همه انجمنها علاوه بر SPE مانند SEG، AAPG و غیره). JPT یک خلاصه خوب و جمع و جور از مقالات ماهانه انجام میدهد که مقالات مروری خوبی دارد. OnePetro، یک منبع آنلاین از مقالات فنی است و دسترسی به بیش از ۲۰۰۰۰۰ مقاله را فراهم میکند.
۲) مجموعه دوم مقالاتی که میتوانید بخوانید IEEE – Institute of Electrical and Electronics Engineers است. طیف وسیعتری از کاربردهای یک الگوریتم خاص برای یک مسئله بهینهسازی یا یک راه حل ابتکاری برای یک مسئله پیچیده را در اختیار شما قرار میدهد.
مصاحبه کننده: معمولاً برای متخصصان جوان، علم داده گاهی اوقات به عنوان سنگ روزتا (سنگنوشتهای از دوران مصر باستان) تلقی میشود. این چیزی است که میتواند همه مشکلاتی را که ما داریم حل کند. فقط از علم داده یا تکنیکهای یادگیری ماشین استفاده کنید و همه چیز درست میشود! توصیه شما به متخصصان جوان در مورد تکنیکهای مختلف علم داده چیست و در هنگام استفاده یا به کارگیری هر یک از این تکنیکها باید از چه رویکردهایی استفاده کنند؟
دکتر ساتیام: علم داده برابر است با “علم روی داده” (science on the data). همه ما نمیتوانیم در همه چیز متخصص باشیم. به عنوان مثال، برخی از افراد ممکن است در بررسی خود دادهها بسیار خوب باشند. مثلاً چگونه میتوانم دادهها را جمعآوری کنم و واقعاً چگونه آن را به شکل و فرم درآورم تا بتوانم برخی از برنامهها یا الگوریتمها را بر روی آن اجرا کنم؟ دیگران ممکن است بگویند اجازه دهید بریم مدلهای خود را بر روی آن بسازیم. و سپس برخی از افراد ممکن است عاشق استفاده از یک یا دو مدل باشند زیرا در آن بسیار متخصص هستند. اما افراد دیگر ممکن است بخواهند بیش از یک مدل یا صدها مدل را کشف کنند و تمام عمر خود را صرف آن کنند. بنابراین، استعدادهای متفاوتی وجود دارد.
و البته، تشخیص الگوی موجود در دادهها سختترین بخش است. زیرا شما میتوانید چیزی را ببینید (در نمودارها)، اما نمیتوانید تفسیر کنید. و این مهارتی است که همه ما واقعاً باید در این صنعت بدانیم. این تنها با خواندن کتاب بدست نمیآید؛ با تمرین و بحث با متخصصان آن حوزه. زمانی که یاد گرفتید این الگوها را تفسیر کنید، زمانی است که در واقع شروع به تبدیل مشکل به راه حل و گفتن یک داستان میکنید. این نحوه رسیدگی به یک مشکل است.
یکی از گیجکنندهترین چیزهایی که در صنعت ما خواهید شنید این است که همه مشتاق دقت مدل هستند. این دقت به چه معناست؟ آیا من یک مدل ۱۰۰٪ دقیق میخواهم که سالها برای ساخت آن وقت بگذارم؟ یک اپراتور را در نظر بگیرید، با ۱۰۰ پمپ در حال کار و به طور معمول، مثلاً، ۵۰٪ از پمپها هر سال از کار میافتند. حال، فرض میکنیم که شما تمام دادهها را برای تمام ۵۰ درصد آن خرابیها (failure) در چندین سال گذشته در اختیار دارید و شما الگوریتمهای بسیار خوبی برای پیشبینی خرابی بر اساس آنچه دارید میسازید. اما دقت شما فقط مثلاً ۶۰ درصد است. آیا آن راهحل را اجرا میکنید یا صبر میکنید و به بهبود ادامه میدهید تا زمانی که به ۱۰۰% برسید؟ اگر مدل من ۶۰ درصد در پیشبینی خرابیها دقت داشته باشد، به این معنی است که از ۵۰ مورد، حداقل میتوانیم ۳۰ خرابی را پیشبینی کنیم. اگر به دنبال ۱۰۰% هستید، به این معنی است که ما باید تمام ۵۰ خرابی را پیشبینی کنیم. حالا اگر بتوانم از آن ۳۰ خرابی جلوگیری کنم، آیا ارزشی ایجاد نکردهام؟ بنابراین، ما باید به علم داده از نظر تولید ارزش نگاه کنیم، نه دقت.
من همیشه میگویم که باید علم داده را مرحله به مرحله انجام دهید. چگونه میتوانم کیفیت یا کمیت دادههای خود را در آینده بهبود بخشم؟ ما نمیتوانیم گذشته را تغییر دهیم، اما میتوانیم آینده را تغییر دهیم. در واقع من میگویم بیایید سنسورهای بیشتری قرار دهیم یا دادهها را با فرکانس بالاتر جمعآوری کنیم.
به یاد داشته باشید، یکی از چیزهایی که من همیشه میگویم: شما میتوانید به مشکلات علم داده از سه طریق فکر کنید:
- چیزی را با استفاده از آن بهینهسازی کنید: در صنعت ما، تقریباً در همه چیز، از یک گردش کار (workflow) ساده گرفته تا یک گردش کار بسیار پیچیده، میتوان بسیاری از بهینهسازیها را انجام داد. وقتی میگویید گردش کار را بهینه کنید، به این معنی است که در واقع دادهها را نیز بهینه میکنید زیرا گردش کار روی دادهها کار میکند.
- خودکارسازی فرایندها: الگوریتمی بنویسید که اجرا شود، بینشهایی را که میخواهیم به ما ارائه دهد، یک طرحبندی زیبا و راهحلی برای مشکل مورد نظر به ما ارائه دهد. اتوماسیون به این معنی است که شما باید به بخش پیشبینی بپردازید و کمی از بخش تجویزی را نیز در آن بررسی کنید.
- یا ساخت یک راه حل کاملا نوآورانه (نوآوری)
ادامه این نوشته را از اینجا بخوانید.
دیدگاهتان را بنویسید