علم‌داده

آشنایی با علم داده (Data Science) و توانایی تحلیل مجموعه‌ داده‌ها (dataset)، اهمیت و کاربرد زیادی در تصمیم‌گیری‌های آگاهانه و صحیح دارند. امروزه بسیاری از کسب‌وکارها از علم داده برای بهبود بخش‌های عملیاتی خود استفاده می‌کنند. کسب‌وکارها به کمک آن می‌توانند الگو‌های رفتاری مشتری‌ها را تحلیل کرده و به موجب آن، باعث افزایش رضایت مشتری و وفاداری او بشوند.

در این ماژول رقابت‌کننده باید بتواند بر اساس خواسته‌ی کارفرما و با استفاده کردن از ابزارهای مجاز، تحلیل‌هایی بر روی داده‌های تجاری انجام دهد؛ برای انجام این‌کار، رقابت کننده باید با python و کتابخانه‌های مرتبط با این موضوعات آشنا باشد. کارهای مورد انتظار در این بخش، شامل این موارد می باشد: آماده سازی داده، حذف یا جایگزینی داده‌های پرت(Data Cleaning)، نمایش و مصورسازی داده‌‌ها (Data Visualization) و به کارگیری الگوریتم‌های یادگیری ماشین (Machine Learning) برای انجام پیشبینی‌هایی مانند میزان فروش در آینده و خوشه‌بندی مشتریان.

Picture1.png

برای مثال، در سال 2024، رقابت‌کننده می‌بایست داده‌های مربوط به مشتریان، محصولات و میزان فروش شرکت Belle Croissant Lyonnais را با استفاده از ابزارهای موجود تحلیل می‌کرد و الگو‌ها را در روند فروش و رفتار مشتریان تشخیص می‌داد، پرفروش‌ترین محصولات و بازه‌های زمانی را مشخص و راه‌هایی برای افزایش میزان فروش شرکت ارائه می‌کرد.

آشنایی با برخی مفاهیم و تعاریف پایه‌ای مربوط به کسب‌وکارها، مانند Total Sales Revenue, Net Revenue, Profit Margin و … می‌تواند خیلی به داشتن درک بهتر از سوالات کمک کند.


تکنولوژی‌های مجاز

رقابت‌کننده باید با کتابخانه‌های زیر آشنا باشد:

  • pandas
  • numpy
  • matplotlib
  • seaborn
  • statsmodels
  • scikit-learn

نرم‌افزارهای نصب‌شده

  • Anaconda
  • PyCharm

آموزش‌های پیشنهادی

ناملینک
Data Analysis with Pythonمشاهده
A complete guide for Data Analysisمشاهده

خلاصه: رقابت‌کننده باید به پایتون مسلط باشد، و همچنین با کتابخانه‌های معرفی شده آشنا باشد و تجربه‌ی کار با آن‌ها را داشته باشد.