چگونه بدون مدرک دانشگاهی مرتبط با علم داده، شغلی با درآمد حداقل ۶۰ هزار دلاری بیابیم؟ (توضیحات دکتر مهرداد غریب شیرنگی)

این پست با استفاده از مطالب سایت دکتر مهرداد غریب شیرنگی (این لینک) نوشته شده است. پس بهتر است در ابتدا به معرفی ایشان بپردازم.

Sr Data Scientist | Machine Learning Engineer عنوان
LinkedIn پروفایل لینکدین
mehr@stanford.edu ایمیل

تحصیلات:

  • دکترا: بهینه‌سازی نفت، دانشگاه استنفورد آمریکا
  • ارشد: مهندسی نفت، دانشگاه تالسای آمریکا
  • لیسانس: مهندسی نفت و مهندسی مکانیک، دانشگاه صنعتی شریف

تجارب کاری:

  • دانشمند داده در شرکت Baker Hughes که یکی از زیرمجموعه‌های شرکت جنرال الکتریک می‌باشد.
  • متخصص بهینه‌سازی مخزن در شرکت QRI آمریکا
  • مهندس شبیه‌سازی و تحلیل داده در شرکت حفاری شمال

دانلود رزومه دکتر مهرداد غریب شیرنگی


علم داده شامل سه مجموعه مهارت است: 

  • آمار
  • علوم رایانه و فناوری اطلاعات (یادگیری ماشین + کد نویسی + SQL)
  • آنچه به آنها مهارت هک کردن می‌گویند!

مقاله جالبی از David L Danoho (استاد آمار استنفورد) با عنوان ۵۰ سال دانش داده (۵۰ years of data science) وجود دارد که در آن بحث می‌کند که علم داده با آمارهای سنتی متفاوت است زیرا: ۱) تأکید بر استنباط نیست بلکه بر یادگیری (یادگیری آماری، یا یادگیری ماشینی) است، ۲) این شامل برخی مهارت‌های فناوری اطلاعات (به عنوان مثال مدیریت پایگاه داده و SQL) و مهارت‌های برنامه‌نویسی است.

برای تبدیل شدن به دانشمند داده، می‌توانید با یکی از دو زبان محبوب علم داده شروع کنید: Python یا R.

پیشنهاد برای مطالعه: دانلود جزوه ۸۷ صفحه‌ای آموزش زبان برنامه‌نویسی پایتون

من Python را ترجیح می‌دهم و به نظر می‌رسد که پایتون با توسعه‌های اخیرش (مانند یادگیری عمیق) پیشرفته‌تر است، اما R جالب توجه است. برخی از کتابخانه‌های کلیدی در پایتون وجود دارد که شما باید با آنها آشنا شوید:

  • pandas
  • numpy
  • matplotlib
  • seaborn
  • sklearn

دو موضوع یادگیری ماشینی که باید با آنها شروع کنید عبارتند از: ۱) رگرسیون و ۲) طبقه‌بندی.

برخی از مجموعه داده‌ها را از UC Irvine Machine Learning Repository دانلود کنید، مجموعه داده‌ها را با استفاده از کتابخانه pandas لود کرده و داده‌ها را با استفاده از matplotlib و seaborn به تصویر بکشانید، داده‌ها را پاکسازی کنید (دوباره با استفاده از پاندا)، پردازش داده‌ها و اعمال برخی الگوریتم‌های طبقه‌بندی و رگرسیون از کتابخانه sklearn.

خوب، شما باید هر یک از روش‌های رگرسیون و طبقه‌بندی را یاد بگیرید، اما برای اعمال آن‌ها، لازم نیست که آن‌ها را دوباره اختراع کنید. برای این کار، شما می‌توانید به کتاب یادگیری آماری توسط Hastie، فریدمن و Tibshirani مراجعه کنید: The Elements of Statistical Learning. برای یادگیری آمار (عمدتا EDA و exploratory data analysis) برای علم داده، یک کتاب عالی برای شروع وجود دارد: thinkstats.

بعد از این، بسته به کاری که می‌خواهید انجام دهید، می‌توانید در جهات مختلف پیشرفت کنید:

  • یادگیری عمیق با استفاده از Keras ، TensorFlow یا PyTorch
  • تصویرسازی داده‌های تعاملی و گسترش وب
  • محاسبات ابری (AWs ، Microsoft Azure ، Google GCP ، …)

من هیچ تجربه کاری ندارم چه می توانم بکنم؟

خوب، ممکن است به یک منتور (mentor) نیاز داشته باشید چون خیلی کارتان راحت‌تر می‌شود. دانش داده بسیار گسترده است و بسته به صنعتی که می‌خواهید وارد آن شوید، ممکن است مهارت‌های مختلفی مورد توجه قرار گیرد. صنعت مدام نسبت به مدرک شما بی‌توجه‌تر و نسبت به مهارت‌های شما حساس‌تر می‌شود.

شرکت‌های زیادی وجود دارند که از افراد برجسته با هیچ تجربه کاری مرتبط با علم دانش بهره می‌برند. آن‌ها رزومه این افراد را ریوایز کرده و برایشان شغلی با درآمد ۶۰ هزار دلار در سال پیدا می‌کنند. همچنین شرکت‌های زیادی وجود دارند که دوره‌های آنلاین به زبان پایتون، یادگیری ماشین و غیره را توسعه می‌دهند و از طریق آن پول درمی آورند! آن‌ها حتی خود درس‌ها را توسعه نمی‌دهند، استعدادهای ارزان‌قیمت استخدام می‌کنند تا آن دوره ها را برایشان ایجاد کنند.

مطمئن نیستم که چرا مردم هنوز هم برای دوره‌های آنلاینی که بهترین آنها به صورت رایگان در دسترس هستند، هزینه پرداخت می‌کنند (خوب، شاید ما نباید جهل مردم را دست کم بگیریم!).

من دارای مدرک دکترا هستم، آیا باید قبل از اشتغال، مدرک علوم داده دریافت کنم؟

اگر شما یک مدرک دکترا یا کارشناسی ارشد دارید و از قبل تجربه برنامه‌نویسی را دارید، پیشنهاد می‌کنم خودآموزی را شروع کنید، چند دوره آنلاین بگذرانید و به خودتان آموزش دهید.

پیشنهاد برای مطالعه: می‌خواهم هوش مصنوعی و یادگیری ماشین را یاد بگیرم. از کجا باید شروع کنم؟ + راهنمای عملی خودیادگیری

به یاد داشته باشید که بهترین دوره‌ها به صورت رایگان در دسترس است. برای مثال می‌توانید با Kaggle Micro-Courses یا Google Machine Learning Crash Course شروع کنید. 

به خاطر داشته باشید که بهترین مدرسه برای یادگیری علوم داده در عمل، “در محل کار” است! اصول را بیاموزید، تحقیق کنید و سؤالات مصاحبه را مرور کنید، مهارت‌های خود را بهبود بخشید و تلاش کنید.

شرکت‌های آمریکایی کمتر به مدرک شما و بیشتر به مهارت‌های شما اهمیت می‌دهند. بسیاری از شرکت‌ها (از جمله گوگل و اپل) هیچگونه الزامی برای مدرک دانشگاهی ندارند.

چگونه یک تیم علوم داده تشکیل دهیم؟

برای شرکت‌هایی که نمی‌خواهند در این بازار رقابتی عقب بیفتند، تشکیل یک تیم داده اولین فکر است. تشکیل تیم خوب ممکن است حداقل دو میلیون دلار هزینه داشته باشد و پیدا کردن دانشمندان داده شایسته کار ساده‌ای نیست.

مردم عادت دارند کارهایشان را مانند گذشته انجام دهند، در حالی که عصر جدید علوم داده یک محیط بسیار پویا با تأکید ویژه بر متن باز (open source) و محاسبات ابری (cloud computing) است.

پیشنهاد برای مطالعه: داده؛ نفت عصر جدید + دانلود جزوه ۸۷ صفحه‌ای آموزش زبان برنامه‌نویسی پایتون

 

لینک اصلی مطلب

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*

code