علمداده
آشنایی با علم داده (Data Science) و توانایی تحلیل مجموعه دادهها (dataset)، اهمیت و کاربرد زیادی در تصمیمگیریهای آگاهانه و صحیح دارند. امروزه بسیاری از کسبوکارها از علم داده برای بهبود بخشهای عملیاتی خود استفاده میکنند. کسبوکارها به کمک آن میتوانند الگوهای رفتاری مشتریها را تحلیل کرده و به موجب آن، باعث افزایش رضایت مشتری و وفاداری او بشوند.
در این ماژول رقابتکننده باید بتواند بر اساس خواستهی کارفرما و با استفاده کردن از ابزارهای مجاز، تحلیلهایی بر روی دادههای تجاری انجام دهد؛ برای انجام اینکار، رقابت کننده باید با python و کتابخانههای مرتبط با این موضوعات آشنا باشد. کارهای مورد انتظار در این بخش، شامل این موارد می باشد: آماده سازی داده، حذف یا جایگزینی دادههای پرت(Data Cleaning)، نمایش و مصورسازی دادهها (Data Visualization) و به کارگیری الگوریتمهای یادگیری ماشین (Machine Learning) برای انجام پیشبینیهایی مانند میزان فروش در آینده و خوشهبندی مشتریان.

برای مثال، در سال 2024، رقابتکننده میبایست دادههای مربوط به مشتریان، محصولات و میزان فروش شرکت Belle Croissant Lyonnais را با استفاده از ابزارهای موجود تحلیل میکرد و الگوها را در روند فروش و رفتار مشتریان تشخیص میداد، پرفروشترین محصولات و بازههای زمانی را مشخص و راههایی برای افزایش میزان فروش شرکت ارائه میکرد.
آشنایی با برخی مفاهیم و تعاریف پایهای مربوط به کسبوکارها، مانند Total Sales Revenue, Net Revenue, Profit Margin و … میتواند خیلی به داشتن درک بهتر از سوالات کمک کند.
تکنولوژیهای مجاز
رقابتکننده باید با کتابخانههای زیر آشنا باشد:
- pandas
- numpy
- matplotlib
- seaborn
- statsmodels
- scikit-learn
نرمافزارهای نصبشده
- Anaconda
- PyCharm
آموزشهای پیشنهادی
خلاصه: رقابتکننده باید به پایتون مسلط باشد، و همچنین با کتابخانههای معرفی شده آشنا باشد و تجربهی کار با آنها را داشته باشد.