چگونه بدون مدرک دانشگاهی مرتبط با علم داده، شغلی با درآمد حداقل ۶۰ هزار دلاری بیابیم؟ (توضیحات دکتر مهرداد غریب شیرنگی)
این پست با استفاده از مطالب سایت دکتر مهرداد غریب شیرنگی (این لینک) نوشته شده است. پس بهتر است در ابتدا به معرفی ایشان بپردازم.
Sr Data Scientist | Machine Learning Engineer | عنوان |
پروفایل لینکدین | |
mehr@stanford.edu | ایمیل |
تحصیلات:
- دکترا: بهینهسازی نفت، دانشگاه استنفورد آمریکا
- ارشد: مهندسی نفت، دانشگاه تالسای آمریکا
- لیسانس: مهندسی نفت و مهندسی مکانیک، دانشگاه صنعتی شریف
تجارب کاری:
- دانشمند داده در شرکت Baker Hughes که یکی از زیرمجموعههای شرکت جنرال الکتریک میباشد.
- متخصص بهینهسازی مخزن در شرکت QRI آمریکا
- مهندس شبیهسازی و تحلیل داده در شرکت حفاری شمال
دانلود رزومه دکتر مهرداد غریب شیرنگی
علم داده شامل سه مجموعه مهارت است:
- آمار
- علوم رایانه و فناوری اطلاعات (یادگیری ماشین + کد نویسی + SQL)
- آنچه به آنها مهارت هک کردن میگویند!
مقاله جالبی از David L Danoho (استاد آمار استنفورد) با عنوان ۵۰ سال دانش داده (۵۰ years of data science) وجود دارد که در آن بحث میکند که علم داده با آمارهای سنتی متفاوت است زیرا: ۱) تأکید بر استنباط نیست بلکه بر یادگیری (یادگیری آماری، یا یادگیری ماشینی) است، ۲) این شامل برخی مهارتهای فناوری اطلاعات (به عنوان مثال مدیریت پایگاه داده و SQL) و مهارتهای برنامهنویسی است.
برای تبدیل شدن به دانشمند داده، میتوانید با یکی از دو زبان محبوب علم داده شروع کنید: Python یا R.
پیشنهاد برای مطالعه: دانلود جزوه ۸۷ صفحهای آموزش زبان برنامهنویسی پایتون |
من Python را ترجیح میدهم و به نظر میرسد که پایتون با توسعههای اخیرش (مانند یادگیری عمیق) پیشرفتهتر است، اما R جالب توجه است. برخی از کتابخانههای کلیدی در پایتون وجود دارد که شما باید با آنها آشنا شوید:
- pandas
- numpy
- matplotlib
- seaborn
- sklearn
دو موضوع یادگیری ماشینی که باید با آنها شروع کنید عبارتند از: ۱) رگرسیون و ۲) طبقهبندی.
برخی از مجموعه دادهها را از UC Irvine Machine Learning Repository دانلود کنید، مجموعه دادهها را با استفاده از کتابخانه pandas لود کرده و دادهها را با استفاده از matplotlib و seaborn به تصویر بکشانید، دادهها را پاکسازی کنید (دوباره با استفاده از پاندا)، پردازش دادهها و اعمال برخی الگوریتمهای طبقهبندی و رگرسیون از کتابخانه sklearn.
خوب، شما باید هر یک از روشهای رگرسیون و طبقهبندی را یاد بگیرید، اما برای اعمال آنها، لازم نیست که آنها را دوباره اختراع کنید. برای این کار، شما میتوانید به کتاب یادگیری آماری توسط Hastie، فریدمن و Tibshirani مراجعه کنید: The Elements of Statistical Learning. برای یادگیری آمار (عمدتا EDA و exploratory data analysis) برای علم داده، یک کتاب عالی برای شروع وجود دارد: thinkstats.
بعد از این، بسته به کاری که میخواهید انجام دهید، میتوانید در جهات مختلف پیشرفت کنید:
- یادگیری عمیق با استفاده از Keras ، TensorFlow یا PyTorch
- تصویرسازی دادههای تعاملی و گسترش وب
- محاسبات ابری (AWs ، Microsoft Azure ، Google GCP ، …)
من هیچ تجربه کاری ندارم چه می توانم بکنم؟
خوب، ممکن است به یک منتور (mentor) نیاز داشته باشید چون خیلی کارتان راحتتر میشود. دانش داده بسیار گسترده است و بسته به صنعتی که میخواهید وارد آن شوید، ممکن است مهارتهای مختلفی مورد توجه قرار گیرد. صنعت مدام نسبت به مدرک شما بیتوجهتر و نسبت به مهارتهای شما حساستر میشود.
شرکتهای زیادی وجود دارند که از افراد برجسته با هیچ تجربه کاری مرتبط با علم دانش بهره میبرند. آنها رزومه این افراد را ریوایز کرده و برایشان شغلی با درآمد ۶۰ هزار دلار در سال پیدا میکنند. همچنین شرکتهای زیادی وجود دارند که دورههای آنلاین به زبان پایتون، یادگیری ماشین و غیره را توسعه میدهند و از طریق آن پول درمی آورند! آنها حتی خود درسها را توسعه نمیدهند، استعدادهای ارزانقیمت استخدام میکنند تا آن دوره ها را برایشان ایجاد کنند.
مطمئن نیستم که چرا مردم هنوز هم برای دورههای آنلاینی که بهترین آنها به صورت رایگان در دسترس هستند، هزینه پرداخت میکنند (خوب، شاید ما نباید جهل مردم را دست کم بگیریم!).
من دارای مدرک دکترا هستم، آیا باید قبل از اشتغال، مدرک علوم داده دریافت کنم؟
اگر شما یک مدرک دکترا یا کارشناسی ارشد دارید و از قبل تجربه برنامهنویسی را دارید، پیشنهاد میکنم خودآموزی را شروع کنید، چند دوره آنلاین بگذرانید و به خودتان آموزش دهید.
پیشنهاد برای مطالعه: میخواهم هوش مصنوعی و یادگیری ماشین را یاد بگیرم. از کجا باید شروع کنم؟ + راهنمای عملی خودیادگیری |
به یاد داشته باشید که بهترین دورهها به صورت رایگان در دسترس است. برای مثال میتوانید با Kaggle Micro-Courses یا Google Machine Learning Crash Course شروع کنید.
به خاطر داشته باشید که بهترین مدرسه برای یادگیری علوم داده در عمل، “در محل کار” است! اصول را بیاموزید، تحقیق کنید و سؤالات مصاحبه را مرور کنید، مهارتهای خود را بهبود بخشید و تلاش کنید.
شرکتهای آمریکایی کمتر به مدرک شما و بیشتر به مهارتهای شما اهمیت میدهند. بسیاری از شرکتها (از جمله گوگل و اپل) هیچگونه الزامی برای مدرک دانشگاهی ندارند.
چگونه یک تیم علوم داده تشکیل دهیم؟
برای شرکتهایی که نمیخواهند در این بازار رقابتی عقب بیفتند، تشکیل یک تیم داده اولین فکر است. تشکیل تیم خوب ممکن است حداقل دو میلیون دلار هزینه داشته باشد و پیدا کردن دانشمندان داده شایسته کار سادهای نیست.
مردم عادت دارند کارهایشان را مانند گذشته انجام دهند، در حالی که عصر جدید علوم داده یک محیط بسیار پویا با تأکید ویژه بر متن باز (open source) و محاسبات ابری (cloud computing) است.
پیشنهاد برای مطالعه: داده؛ نفت عصر جدید + دانلود جزوه ۸۷ صفحهای آموزش زبان برنامهنویسی پایتون |
دیدگاهتان را بنویسید