اندر تفاوتهای ML در ریسرچ و پروداکشن
تا حالا زیاد درباره تفاوتهای نگاه در یادگیری ماشین به جهت ریسرچ و پروداکشن صحبت شده
. اما در این پست به بهانه معرفی کتاب Designing Machine Learning Systems میخواستیم که خیلی جمع و جور و خلاصه این تفاوت نگاه رو به رشته تحریر دربیاریم
. همونطور که در تصویر دوم ضمیمهشده مشخصه (این جدول برگرفته از فصل اول این کتابه) یکی از ملموسترین تفاوتها بحث اولویت محاسباتیه که در ریسرچ، بیشتر تمرکز بر روی کوتاهتر کردن زمان Train گذاشته میشه اما در پروداکشن بیشتر تمرکز بر روی زمان inference کوتاهه. یا مثلا بحث distribution shiftهای مداوم که در یک مساله تحقیقاتی شاید کمتر اتفاق بیفته.
اما به نظر مهمترین تفاوت که عمدتا باعث fail شدن پروژههای ML در صنعت میشه همون سطر اول این جدوله که شاید برای افراد ناملموستر باشه. بله؛ وجود افراد در سازمان با نگاههای متفاوت که هر کدوم به نوعی هدف و سهمی از این نوع پروژهها دارند، مهمترین تهدید و همزمان مهمترین فرصت برای این پروژههاست. اگر بتونیم به جای تمرکز بر متریکهای تکنیکال بر روی بهبود متریکهای بیزنسی تمرکز کنیم این تهدید رو تبدیل به فرصت کردیم و در غیر این صورت باید بریم خونههامون.
در آینده منتظر پستهای بعدی از این کتاب باشید.
لینک کتاب:
https://www.amazon.com/Designing-Machine-Learning-Systems-Production-Ready/dp/1098107969
#book
@nlp_stuff