#Pythonاگر با
python رو لپتاپ CSV میخونید( دیتاست های تمرینی امازون،کگل و ...) باید بگم که خوبه، راه میندازه شما رو ولی دیتای اکثر بیزنس ها نه این قدر well sructured هست نه تمیز نه csv نه میشه رو لپتاپ ران کرد.
برای اینکه به عنوان data scientist بتونید خروجی درست و actionable بدید
باید علاوه بر استفاده از الگوریتم و تست الگوریتم بتونید مدلتون رو توضیح بدید یا بتونید براش مدل تست scientific ارائه بدید، یعنی چی؟
یعنی روی تفسیر مدل یه آزمایش علمی( ر.ک پوپر، ابطال پذیری) طراحی کنید که مثلا AB Test یکی از سناریوهای معروف هست.
حالا شما تازه وارد دنیای تحلیل شدید که به شناخت یک مساله رسیدید و توی چرخه ی تست و بهبود افتادید و یک پروژه ی دیتاساینس تو دنیای واقعی انجام دادید یا در حال انجامید.
سعی کنید کنار پایتون چیزایی مثل spark و SQL و مفاهیمی مثل parallelism رو هم تا حدی که کارتون راه بیفته یاد بگیرید
@DevTwitter |<چلیم دار جوان/>