Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Data Science | علم داده avatar
Data Science | علم داده
Data Science | علم داده avatar
Data Science | علم داده
👨‍💻 خداحافظی با دردسرهای استخراج متن از فایل‌های pdf!


👨🏻‍💻 اگه تا حالا خواستی از یه فایل pdf متنی رو بکشی بیرون، احتمالاً با این مشکل روبرو شدی که یه عالمه هدر، فوتر و شماره صفحه هم قاطی متن اصلی می‌شه! واقعاً اعصاب خورد کنه.

✅ خوشبختانه تو کتابخونه pypdf یه قابلیت به اسم visitor_text هست که دقیقاً برای همین کار ساخته شده:

💬 با استفاده ازش می‌تونی شرط بذاری. مثلاً فقط متن‌هایی که فونتشون از یه حدی بزرگ‌تره استخراج بشن و همون بخش‌های اضافی و مزاحم رو هم فیلتر کنی.

💯 اینجوری هم خروجیت خیلی شسته‌رفته‌تر میشه و هم می‌تونی ازش برای پردازش متن، خلاصه‌سازی یا آموزش مدل‌های زبانی استفاده کنی.

pip install pypdf


🏳️‍🌈 pypdf
📖 Documentation
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
🔴 آخرین فرصت برای ثبت نام در ۳ دوره آموزشی آنلاین مرتبط با داده و هوش مصنوعی در مدرسه دقیقه

🟢 استخراج داده از وب (چهارشنبه‌ها ساعت ۱۸:۰۰)

d-learn.ir/wbsp?utm=kcl

🟠 پردازش بهینه با pandas و polars (دوشنبه‌ها ۱۸:۰۰))

d-learn.ir/pyps?utm=kcl

🔵 یادگیری ماشین با پایتون (یکشنبه‌ها ۱۸:۰۰)

d-learn.ir/mlpy?utm=kcl

⏳ امکان ثبت نام با تخفیف همچنان وجود دارد:

🙂 کد تخفیف 30% برای پرداخت کامل: KzC30
🙂 کد تخفیف 20% برای پرداخت قسطی: ZsM20

🔽 شروع از همین هفته!

🔴 با تخفیف ویژه برای ثبت نام گروهی و ثبت نام در چند دوره (در صورت تمایل به پشتیبانی پیام بدهید)


📲 تماس با پشتیبانی:
@dlearnsup
09103209837
02188349244

@dlearn_ir
01.05.202519:45
💠 کتابچه «یادگیری اصولی Git از پایه»


👨🏻‍💻 چند سالی بود با Git کار می‌کردم، ولی همیشه یه جاهایی گیج می‌شدم—مخصوصاً سر rebase یا stash!

✅ چند روز پیش یه کتابچه ۵۰ صفحه‌ای پیدا کردم که Git رو از پایه و اصولی توضیح می‌ده، از دستورات ساده تا حرفه‌ای. کمکم کرد که بفهمم پشت هر دستور Git چه اتفاقی می‌افته.

✅ کار با دستورات مهمی مثل stash ،rebase و checkout

✅ مدیریت پیشرفته ریپو‌های لوکال

✅ مدیریت Branch‌ها و فرآیند Merge



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
Deleted03.05.202512:18
💡 فرصت ویژه برای ورود به دنیای تحلیل داده! 

🚀 داده‌ها را به بینش‌های ارزشمند و تصمیمات هوشمندانه تبدیل کنید! 
📊 با دوره جامع Power BI، تحلیلگر حرفه‌ای شوید! 

🔥 چرا این دوره؟ 
۲۰ پروژه عملی و کاربردی 
تحلیل داده‌های مالی، فروش، بازاریابی و منابع انسانی 
استفاده از هوش مصنوعی در تحلیل داده‌ها 
ساخت داشبوردهای حرفه‌ای و بصری‌سازی داده‌ها 
آموزش کسب درآمد از تحلیل داده 💰 
پشتیبانی ۲۴ ساعته + ضمانت بازگشت وجه 

💰 قیمت اصلی: ۲ میلیون تومان 
🔥 تخفیف ویژه فقط برای ۱۰ نفر اول:
۹۹۹ هزار تومان
 

💰 بازار کار تحلیل داده در حال رشد است! 
همین حالا ثبت‌نام کنید و مسیر موفقیت خود را آغاز کنید! 

🔗 مشاهده جزئیات و ثبت‌نام 

💬 مشاوره رایگان در تلگرام! 
نمی‌دانید از کجا شروع کنید؟ نمی‌دانید این دوره برای شما مناسب است؟ یا چطور می‌توانید در کمترین زمان، بیشترین نتیجه را بگیرید؟ 
📩 پیام دهید و پاسخ همه‌ی سوالاتتان را بگیرید:
@barzegarme
29.04.202519:30
🔖 راهنمای ساخت «پورتفولیوی علم داده»


👨🏻‍💻 رزومه کافی نیست! اما یه پورتفولیو درست و حسابی می‌تونه کافی باشه، اونم نه فقط نشون دادن مهارت‌ها!

✅ این راهنمای بی‌نظیر بهت یاد می‌ده که چطوری یه پورتفولیوی خفن برای پروژه‎‌ها و مهارت‌هات در علوم داده بسازی.👌



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
۸۷ درصد تخفیف ثبت نام سمینار آموزشی هوش مصنوعی و علم داده در کسب و کار جهاددانشگاهی صنعتی امیرکبیر

🔸 میزان تخفیف توسط حامیان درنظر گرفته شده است.🔸

🔻زمان برگزاری: ۱۷ اردیبهشت | ساعت ۱۴ الی ۱۸
🔻مهلت ثبت نام: ۱۵ اردیبهشت
🔻با ارائه گواهینامه معتبر و قابل ترجمه
🔻ثبت نام برای عموم آزاد است

📍 محل برگزاری: دانشگاه صنعتی امیرکبیر

✅ ثبت‌نام و دریافت تخفیف: @amirkabirjde_admin

☎️ 02188895969
➖➖➖➖➖➖➖➖➖➖➖➖➖
🔴 اطلاعات بیشتر در سایت:
🌐 https://amirkabir.jde.ir/fa/page/931
➖➖➖➖➖➖➖➖➖➖➖➖➖
#هوش_مصنوعی #علم_داده #کسب_و_کار #مدیریت #آموزش #جهاددانشگاهی #صنعتی_امیرکبیر
@amirkabirjde
🔥🚀 با یادگیری ماشین، آینده را کدنویسی کن! 🤖💡

آیا می‌خواهید به دنیای هوش مصنوعی ورود کنید و با داده‌ها معجزه کنید؟ ✨📊
دوره یادگیری ماشین با پایتون فرصتی استثنایی برای یادگیری از صفر تا پیشرفته!

🎯 چرا این دوره؟
✅ یادگیری عمیق و کاربردی با پروژه‌های واقعی 🛠️
✅ از مفاهیم پایه تا مدل‌های پیشرفته 🤓
✅ مناسب برای ورود به بازار کار علوم داده و AI 💼

⏳ فرصت رو از دست نده! همین الان ثبت‌نام کن!
➖➖➖➖➖➖➖➖➖
برای کسب اطلاعات بیشتر به لینک زیر مراجعه کنید↙️
https://B2n.ir/z73050
➖➖➖➖➖➖➖➖➖
☎️مشاوره و ثبت نام
02167641999
📲مشاوره تلگرام
09222477250
➖➖➖➖➖➖➖➖➖
✓ جهاد دانشگاهی صنعتی شریف؛ یک پله بالاتر از تخصص
🖥 ریپو‌های گیت‌هابت رو با یه ترفند تبدیل به ویکی کن!


👨🏻‍💻 همیشه کار کردن با یه ریپوی جدید تو گیت‌هاب می‌تونه چالش‌برانگیز باشه؛ کلی کد پیچیده، اسناد ناقص، و وقت‌گذرونی زیاد برای فهمیدن ساختارش!

✔️ ولی DeepWiki دقیقاً برای حل این مشکل ساخته شده. کافیه تو URL ریپو، “github” رو با “deepwiki” عوض کنی. یه ویـکی کامل، تعاملی و هوشمند تحویلت می‌ده!


1️⃣با هوش مصنوعی، کدها و فایل‌ها رو تحلیل می‌کنه و همه چیز رو ساده توضیح می‌ده.

2️⃣دیاگرام‌های تعاملی می‌سازه که ساختار و وابستگی‌ها رو نمایش بده.

3️⃣یه دستیار هوش منصوعی هم همیشه آماده‌ست که سؤال‌هات رو جواب بده.👇


📑 DeepWiki
🌎 Website



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
01.05.202515:45
🥇 دستورات طلایی Pandas و NumPy که هر دیتا ساینتیستی باید بلد باشه!


1️⃣ بررسی و شناخت دیتا


✅ ستون‌ها، نوع داده، تعداد مشاهده:

df.info()

✅ آمار توصیفی:

df.describe()

✅ نمایش چند ردیف اول یا آخر:

df.head(5)
df.tail(5)

✅ شکل و ابعاد دیتافریم:

df.shape

➖ ➖ ➖

2️⃣ مدیریت داده‌های گمشده


✅ شمارش داده‌های Null هر ستون:

df.isna().sum()

✅ حذف ردیف‌هایی که داده گمشده دارن:

df.dropna(subset=['column_name'])

✅ جایگذاری مقدار جدید به جای missing values:

df.fillna({'col1': 0, 'col2': 'unknown'})

✅ پر کردن مقادیر گمشده با روش Interpolation:

df.interpolate(method='linear')

➖ ➖ ➖

3️⃣ انتخاب و فیلتر کردن دیتا


✅ انتخاب چند ستون خاص:

df[['col1', 'col2']]

انتخاب بر اساس ایندکس:

df.iloc[:, 1:5]

✅ انتخاب با لیبل:

df.loc[:, 'col1':'col5']

✅ فیلتر کردن براساس شرط:

df[df['age'] > 30]

✅ اعمال فیلتر پیچیده:

df.query('age > 30 & salary > 50000')

✅ انتخاب n ردیف با بزرگ‌ترین مقدار:

df.nlargest(5, 'value')

✅ نمونه‌گیری تصادفی:

df.sample(frac=0.1, random_state=42)

➖ ➖ ➖

4️⃣ تغییر و تبدیل دیتا


✅ گروه‌بندی داده و محاسبه میانگین:

df.groupby('category').mean()

✅ ساخت Pivot Table:

df.pivot_table(index='category', values='value', aggfunc='mean')

✅ جدول Cross Tabulation:

pd.crosstab(df.category, df.subcategory)

✅ تبدیل به تاریخ:

pd.to_datetime(df['date_column'])

✅ بازنمونه‌گیری داده‌ها:

df.resample('M').mean()

✅ استخراج ماه از ستون‌های تاریخ:

df['month'] = df['date'].dt.month

✅ محاسبه میانگین متحرک:

df.set_index('date').rolling(window=7).mean()

➖ ➖ ➖

5️⃣ دستورات مهم NumPy


✅ ساخت آرایه از یک لیست:

np.array([1, 2, 3])

✅ ایجاد آرایه صفر:

np.zeros((3, 4))

✅ ایجاد نقاط با فاصله‌ی یکسان:

np.linspace(0, 1, 100)

✅ تغییر شکل آرایه:

np.reshape(arr, (3, 4))

✅ محاسبه میانگین و انحراف معیار:

np.mean(arr, axis=0)
np.std(arr)

✅ ضرب ماتریس‌ها:

np.dot(a, b)

✅ محاسبه معکوس ماتریس:

np.linalg.inv(matrix)

➖ ➖ ➖

6️⃣ تمیز کردن و ترکیب دیتا


✅ انجام Join:

pd.merge(df1, df2, on='key')

✅ اتصال دیتافریم‌ها به همدیگه:

pd.concat([df1, df2], axis=0)

✅ حذف رکوردهای تکراری:

df.drop_duplicates()

✅ جایگذاری مقدار جدید داخل دیتا:

df.replace({'old_val': 'new_val'})

✅ استفاده از فانکشن روی ستون:

df['col'].apply(lambda x: x.lower())

✅ تبدیل نوع داده‌ها:

df.astype({'col1': 'int', 'col2': 'category'})



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
30.04.202519:30
☑️ پروژه علم داده من
1️⃣ عوامل موثر بر کشاورزی هوشمند


👨🏻‍💻 تو یکی از پروژه‌هام، داده‌های ۵۰۰ مزرعه رو بررسی کردم تا بفهمم چی باعث تفاوت برداشت محصول میشه و چطور میشه با هوش مصنوعی کشاورزی رو بهینه کرد.


✏️ خلاصه کاری که انجام دادم: شاخص NDVI (نشانگر سلامت گیاه با ماهواره) دقیقاً با برداشت بالا رابطه داره. چند مدل مختلف ساختم (رگرسیون خطی، جنگل تصادفی، XGBoost) و فهمیدم تعامل فاکتورها از بررسی جدا جدا مهم‌تره.


📣 از دیتاست و کد نویسی گرفته تا آنالیز و نتایج پروژه، همگی در لینک‌‌های زیر موجوده.👇


┌ 🌾 Smart Farming for Food Security
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa🌾
📌 سرمایه‌گذاری روی یادگیری، سرمایه‌گذاری روی آینده است

🌟 دوره جامع علم داده و هوش مصنوعی: ۳۵۰ ساعت آموزش پروژه‌محور با معرفی بیش از ۱۲ ابزار کاربردی
📞 09377516759
📞 09357516755
🌟 دوره ی حرفه ای تحلیل داده‌های کسب‌وکار: ۵۰ ساعت آموزش فشرده با تضمین قبولی در آزمون بین‌المللی CBDA
❤️ 09377516835

🌟 دوره جامع هوش تجاری: ۱۶۰ ساعت آموزش مفاهیم و تسلط بر تحلیل داده‌ها و طراحی داشبوردهای مدیریتی حرفه‌ای
📞 09377516682

5️⃣🛍 تخفیف هدیه ما به شما🎁
به مناسبت روز دختر و ولادت حضرت معصومه ، فقط برای مدت محدود
‼️

❕ با شرکت در دوره‌های تخصصی تهران دیتا، مسیر شغلی خود را هوشمندانه‌تر انتخاب کنید👍
✈️ Telegram | 📱 linkedin | 📷 Instagram | 🌐 website
🔹 نمایِ کلی پروژه‌های گیت‌هاب رو تو چند ثانیه ببین!


👨🏻‍💻 وقتی روی پروژه‌های بزرگ یا اوپن‌سورس کار می‌کنم، اینکه نمایِ کلی پروژه رو ببینم، خیلی کمک‌کننده‌ست.

✏️ ابزار GitDiagram دقیقا میاد هر ریپوی گیت‌هاب رو به یه نمودار تعاملی تبدیل می‌کنه.


◀️ روش کارش هم خیلی ساده‌ست:

⬅️ فقط کافیه تو لینک گیت‌هاب، کلمه‌ی hub رو با diagram عوض کنی. خودکار یه دیاگرام تعاملی از پروژه برات می‌سازه.

نتیجه؟ تو چند ثانیه می‌تونی یه دید کلی از پروژه بگیری بدون اینکه بخوای همه فولدرها و فایل‌ها رو یکی‌یکی باز کنی.


🐱 GitDiagram
🌎 Website



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
توجه!
وبینار رایگان خفن برای دوستانی که دنبال پروژه های خارجی و درآمد دلاری هستند...

* سرفصل‌های مهم این وبینار:
- معرفی پلتفرم‌های جهانی فریلنسری
- شرایط حضور در بازارهای جهانی
- میزان مهارت و میانگین حقوق دریافتی

✅ این وبینار مناسب چه رشته‌هایی هست؟
- برنامه‌نویسی، طراحی سایت، UI & UX دیزاین، معماری، تحلیل داده، موشن گرافیک، دیتا ساینس و... .


📌 لینک ثبت‌نام مستقیم رایگان :
https://links.etekanesh.com/dtscience
03.05.202509:28
◀️ می‌خوای امسال دیتاساینتیست شی؟

1️⃣ بوت‌کمپ دیتاساینس با اساتیدی از بهترین شرکت‌ها رو ثبت‌نام کن

2️⃣ مدرک معتبر بگیر و با کمک ما استخدام شو.

⭕️ ۲۵٪ تخفیف ثبت‌نام زودهنگام!

کلیک کن👇👇
https://dnkr.ir/2nJZA
https://dnkr.ir/2nJZA
Reposted from:
FaraDars_Course avatar
FaraDars_Course
01.05.202514:28
🔴 خبر فوری: شگفتی تمدید شد...
 
۵۵۰ + ۱۵۰ آموزش پرمخاطب در فرادرس،
 
فقط ۷۹ هزار تومن 🔴
 
آموزش‌های منتخب «یادگیری ماشین و علم داده» 👇
 
▪️ یادگیری عمیق در پایتون با TensorFlow و Keras
 
▪️ آموزش هوش مصنوعی – مقدماتی
 
▪️ کاربرد ChatGPT در برنامه نویسی پایتون
 
▪️ ریاضی برای یادگیری ماشین + پیاده سازی در پایتون
 
▪️ آموزش pandas - تحلیل اطلاعات در پایتون
 
🔗 لیست ۱۵۰ آموزش جدید [+]
 
🔗 لیست تمامی ۷۰۰ آموزش - [کلیک کنید]

🔄 FaraDars - فرادرس
⚡️ با دو خط کد، سرعت FastAPI رو بالا ببر!


👨🏻‍💻 اگه APIت داده‌های زیادی رو ارسال می‌کنه، GZipMiddleware هم مصرف اینترنت رو کم می‌کنه و هم سرعت رو بالا می‌بره:


✅ فقط کافیه این دو خط رو به اپلیکیشنت اضافه کنی:👇

from fastapi.middleware.gzip import GZipMiddleware



◀️پارامتر minimum_size می‌گه از چه حجمی به بعد فشرده‌سازی شروع بشه.

◀️با compresslevel هم میزان فشرده‌سازی رو تنظیم می‌کنه (عدد بالاتر = فشرده‌تر ولی کندتر).



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
29.04.202515:40
☑️ پروژه علم داده من
9️⃣ پیش‌بینی درآمد فروش شکلات


👨🏻‍💻 اخیراً تو بوت‌کمپ علم داده روی پروژه‌ای کار کردم که هدفش تحلیل فروش شکلات و پیش‌بینی دسته‌بندی سفارش‌ها بر اساس درآمد بالا یا پایین بود.


✏️ خلاصه کاری که انجام دادم: مدل‌هایی مثل جنگل تصادفی، KNN، درخت تصمیم و رگرسیون لجستیک رو تست کردم و بهترین نتیجه رو از جنگل تصادفی گرفتم با دقت ۱۰۰٪!


📣 از دیتاست و کد نویسی گرفته تا آنالیز و نتایج پروژه، همگی در لینک‌‌های زیر موجوده.👇


┌ 🍫 Chocolate Sales Prediction
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
🔹خانه هوش ایران با همکاری شاخه دانشجویی IEEE دانشگاه تهران برگزار میکند:

🔺"کارگاه آموزشی پایتون" 🔺

زمان: 25 و 26 اردیبهشت ماه 1404
ساعت 9 الی 14

مکان: خیابان کارگرشمالی_روبروی کوی دانشگاه_ ورودی پردیس شماره ۱ _دانشکده مطالعات جهان

🔵 ثبت نام از طریق
iranai.landin.ir/ai

دارای 25 درصد تخفیف دانشجویی
----------------------------------------------------------
برای اطلاعات بیشتر و ارتباط با ادمین:
@iranaihouseadmin

کانال ارتباطی تلگرام خانه هوش
@IntelligenceHouse
03.05.202516:30
💠 جزوه فارسی آموزش جامع «Pandas»


👨🏻‍💻 یه جزوه کامل و کاربردی درباره کتابخانه‌ی pandas در پایتون آماده کردم که از صفر تا صد کار با داده‌ها رو بهتون یاد میده.

✏️ از ساخت Series و DataFrame شروع می‌کنه، بعد سراغ تحلیل داده‌های واقعی مثل آمار کرونا می‌ره، حتی ترفندهای حرفه‌ای مثل گروه بندی و ترکیب DataFrameها رو هم یادتون می‌ده.

همه‌چی رو ساده، قدم‌به‌قدم و با مثال‌های عملی توضیح دادم تا چه تازه‌کار باشین و چه حرفه‌ای، واقعاً ازش لذت ببرین!

✅ مرتب کردن داده‌ها به شکل جدول‌های شیک و کاربردی.

✅ کار با فایل‌های CSV و اکسل برای پروژه‌های واقعی.

✅ تسلط به ابزارهایی مثل groupby ,merge و join برای تحلیل‌های پیشرفته.

✅ و تمرین‌هایی که کمک می‌کنه خودتون دست به کد بشین.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
🔴 دوره جامع «داده‌کاوی»
🖥 دانشگاه کارنگی ملون آمریکا


👨🏻‍💻 دانشگاه کارنگی آمریکا اومده دوره داده کاوی رو در 25 لکچر به رایگان در اختیار علاقه‌مندان این حوزه قرار داده.

◀️تو این دوره از یه طرف با مفاهیم آماری و روش‌های انتخاب مدل سر و کار داری، و از یه طرف دیگه هم باید این مفاهیم رو به صورت عملی پیاده‌سازی کنی و نتایج رو ارائه بدی.

◀️تمرین‌ها هم ترکیبی‌ان؛ هم تئوری، هم کدنویسی و عملی.👇


🥵 Data Mining
⏯️ Course Homepage



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
برای شروع مسیر دیتا، چه پروژه‌هایی باید تو پورتفولیوت باشه؟


👨🏻‍💻 اگه می‌خوای تو سال ۲۰۲۵ وارد حوزه دیتا بشی، داشتن یه پورتفولیوی قوی اولین قدمه. اما واقعاً چه پروژه‌هایی رو باید تو پورتفولیوت بذاری؟ بستگی داره دنبال چه نقشی باشی!


اگه دوست داری دیتا ساینتیست محصول بشی:

◀️ تحلیل اکتشافی دیتا
◀️ تست A/B
◀️ ساخت مدل‌های یادگیری ماشین
◀️ استنتاج علّی

➖➖➖➖➖➖

برای دیتا ساینتیست یادگیری ماشین:

◀️ پروژه ساخت مدل یادگیری ماشین
◀️ پروژه پاک‌سازی و آماده‌سازی داده
◀️ ارزیابی و بهینه‌سازی مدل‌ها
◀️ کار با تکنولوژی‌های Big Data

➖➖➖➖➖➖

اگه هدفت مهندس داده شدن هست:

◀️ توسعه ETL برای انتقال و پردازش داده
◀️ مدیریت دیتابیس‌ها
◀️ خودکارسازی پایپلاین داده
◀️ آشنایی با پلتفرم‌های ابری

➖➖➖➖➖➖

و اگه دنبال نقش تحلیلگر داده هستی:

◀️ تسلط به SQL
◀️ اکسل پیشرفته
◀️ مصوری‌سازی داده
◀️ تعریف شاخص و تهیه گزارش

➖➖➖➖➖➖


✅ خلاصه اینکه مسیر دیتا برای هر نقشی متفاوته! قبل از شروع هدف خودتو مشخص کن و پروژه‌هاتو تو همون مسیر پیش ببر.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
30.04.202506:40
چطور یه پروژه دیتا ساینس رو حرفه‌ای شروع کنیم؟


👨🏻‍💻 اگه داری خودآموز مسیر دیتا ساینس رو یاد می‌گیری، احتمالاً با این سؤال روبه‌رو شدی: "خب حالا از کجا شروع کنم؟ اول دیتا؟ مدل؟ یا چی؟"


✔️ یه نقشه راه ساده ولی کاربردی:👇


1️⃣ صورت‌ مسئله‌ات رو دقیق تعریف کن!

✏️ می‌خوای چی رو حل کنی؟ تشخیص تقلب؟ پیش‌بینی بارش؟ همه چی از اینجا شروع می‌شه.

➖ ➖ ➖ ➖ ➖ ➖ ➖

2️⃣ بررسی کن داده‌ات اصلاً قابل تهیه هست یا نه!

✏️ می‌تونی دیتا گیر بیاری یا نه؟ اگه نه، مسئله‌ت رو تغییر بده.

➖ ➖ ➖ ➖ ➖ ➖ ➖

3️⃣ داده‌ت رو بشناس!

✏️ ساختارش چیه؟ چندتا ستون و سطر داره؟ دیتای گم‌شده داره یا نه؟

➖ ➖ ➖ ➖ ➖ ➖ ➖

4️⃣ پاک‌سازی و ویژگی‌سازی

✏️ داده‌ها رو تمیز کن، ستونای به درد نخور رو بنداز دور، و ستونای جدید بساز.

➖ ➖ ➖ ➖ ➖ ➖ ➖

5️⃣ تحلیل داده (واسه آنالیست‌ها)

✏️ الگوها رو پیدا کن، داشبورد درست کن، از ابزارایی مثل Tableau یا matplotlib استفاده کن.

➖ ➖ ➖ ➖ ➖ ➖ ➖

6️⃣ مدل‌سازی اولیه (واسه دیتا ساینتیست‌ها)

✏️ مدل مناسب رو انتخاب کن، دیتا رو تقسیم کن، و یه مدل اولیه بساز.

➖ ➖ ➖ ➖ ➖ ➖ ➖

7️⃣ بهینه‌سازی مدل

✏️ هایپرپارامترها رو تنظیم کن تا مدل بهتر بشه.

➖ ➖ ➖ ➖ ➖ ➖ ➖

8️⃣ ارزیابی مدل

✏️ معیارهای عملکرد رو بررسی کن (مثل اینکه معیارت F1-Score باشه یا RMSE).

➖ ➖ ➖ ➖ ➖ ➖ ➖

9️⃣ ارائه و دیپلوی

✏️ نتیجه رو خوب مستند کن. می‌تونه یه نوت‌بوک، گزارش PDF یا یه پروژه قابل نمایش باشه.

➖ ➖ ➖ ➖ ➖ ➖ ➖

🔹 یادت باشه دیتا ساینس یه روند تکراریه، هر مرحله رو می‌تونی برگردی و بهترش کنی!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
👨‍💻 خداحافظی با مشکلات کار با تاریخ و زمان در پایتون!


👨🏻‍💻 اگه همیشه با کدنویسی تاریخ و زمان در پایتون درگیر بودی، وقتشه که Pendulum رو امتحان کنی!

✅ یه نسخه پیشرفته‌تر از کتابخانه‌ی datetime داخلی پایتون هست که کار رو خیلی ساده‌تر می‌کنه.


🏳️‍🌈 Pendulum
✍️ Documentation
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
28.04.202517:40
🏳️‍🌈 جزوه خلاصه من از کتابخانه «NumPy»


👨🏻‍💻 یکی از ابزارایی که تو مسیر دیتا ساینتیست شدن کلی کمکم کرد، تسلط به NumPy بود. برای همین تصمیم گرفتم یه خلاصه جمع و جور از تکنیک‌های مهمش درست کنم.


📂 تو این خلاصه به این موضوعات پرداختم:

⬅️ساخت، تغییر شکل و برش آرایه‌ها
⬅️انجام محاسبات ریاضی و آماری روی داده‌ها
⬅️ماتریس و جبر خطی با NumPy
⬅️ ترکیب قدرت NumPy با Pandas

🎯 مسلط شدن روی این تکنیک‌ها می‌تونه سرعت و کیفیت تحلیل داده‌هاتون رو چند برابر کنه!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa
Shown 1 - 24 of 418
Log in to unlock more functionality.