آموزش منطق و مقدمات برنامه نویسی به همراه الگوریتم و فلوچارت آموزش منطق و مقدمات برنامه نویسی به همراه الگوریتم و فلوچارت

آموزشگاه برنامه نویسی تحلیل‌داده

با مجوز رسمی از سازمان فنی و حرفه‌ای کشور

ورود / ثبت‌نام

ورود کاربر جدید هستید؟ ثبت نام کنید

دوره آموزش یادگیری ماشین

دوره آموزش یادگیری ماشین
ثبت نام دوره
نوع دوره شهریه نام استاد مدت زمان تاریخ شروع زمان برگزاری پیشنیاز وضعیت دوره
حضوری یا آنلاین 6,500,000 تومان مهندس مصطفایی 64 ساعت 1403/10/14 جمعه 13:30 تا 17:30 برنامه نویسی پایتون
درحال برگزاری
لغو ثبت نام
ثبت نام
نوع ثبت نام قیمت تخفیف نقدی مبلغ کل شرایط ثبت نام نوع کلاس ثبت نام
نقدی 6,500,000 تومان تومان 6,500,000 تومان پرداخت کل مبلغ هنگام ثبت نام ثبت نام نقدی

دوره ماشین لرنینگ چه خبره ؟

دوره ماشین لرنینگ ما کاملاً پروژه‌محوره ! از تحلیل داده‌ها با Numpy و Pandas شروع می‌کنی و با مدل‌هایی مثل Perceptron ، Logistic Regression ، SVM و KNN آشنا می‌شی. همچنین، با تکنیک‌هایی مثل Bagging و Boosting و کاهش ابعاد با LDA و PCA کار می‌کنی. در نهایت با PyTorch و مفاهیم یادگیری عمیق (Deep Learning) آشنا می‌شی و یاد می‌گیری چطور مدل‌هات رو ترین و ذخیره کنی. همه چی رو به صورت عملی یاد می‌گیری!

کلاس‌های ما تمرینی و پروژه‌محورن ! توی دوره، با پروژه‌های واقعی کار می‌کنی و استاد همیشه کنارت هست تا همه تمرین‌ها و سوالاتت رو جواب بده. تمرینات و کدهای پروژه‌هات رو توی پنل دانشجویی بارگذاری می‌کنی و استاد هم اونا رو ارزیابی می‌کنه . حتی بعد از دوره هم می‌تونی از پشتیبانی استفاده کنی تا هر مشکلی رو حل کنی. این دوره یه تجربه یادگیری عمیق و کاربردی از ماشین لرنینگه که تو رو برای دنیای داده و هوش مصنوعی آماده می‌کنه!

برای دسترسی راحت تر به محتوای مورد نظر، روی آن کلیک کنید.
آنچه که در دوره آموزش یادگیری ماشین (Machine learning) میآموزیم
  • آیا یادگیری مهارت ماشین لرنینگ در سال 2025 ضروری است؟
  • یادگیری ماشین چیست؟
  • برخی از روش های یادگیری ماشین
  • چرا یادگیری ماشین مهم است؟
  • کاربردهای یادگیری ماشین
  • یادگیری ماشین چگونه کار می کند؟
  • چرا پروژه های یادگیری ماشین را با زبان برنامه نویسی پایتون (Python) انجام می دهیم؟
  • توضیحاتی راجع به دوره یادگیری ماشین
اهداف دوره آموزشی یادگیری ماشین
مخاطبین دوره یادگیری ماشین
سرفصل های دوره یادگیری ماشین
  • بخش اول: مروری بر پیشنیاز های یادگیری ماشین
  • بخش دوم: مقدمه ای بر یادگیری ماشین و کاربرد آن
  • بخش سوم: یادگیری با نظارت (مدل های Classification)
  • بخش چهارم: اکتشاف، پاکسازی و پیش پردازش داده ها (EDA, Preprocessing, Data cleaning)
  • بخش پنجم: کاهش ابعاد
  • بخش ششم: آموزش کار با داده های نامتوازن (imbalanced)
  • بخش هفتم: اعتبارسنجی، ارزیابی و بهبود مدل و تنظیم هایپرپارامترها
  • بخش هشتم: یادگیری ماشین ترکیبی (Ensemble Machine Learning)
  • بخش نهم: آموزش یادگیری با نظارت (مدل های Regression)
  • بخش دهم: یادگیری غیر نظارت شده

آنچه که در دوره آموزش یادگیری ماشین (Machine learning) میآموزیم


دوره آموزش ماشین لرنینگ

در دوره آموزش یادگیری ماشین (Machine Learning) با پایتون در آموزشگاه تحلیل داده، ضمن آموزش الگوریتم های یادگیری ماشین که در scikit-learn پیاده سازی شده، ریاضیات و تئوری تمام الگوریتم های یادگیری ماشین به همراه پیاده سازی آنها در پایتون تدریس می شود. اکنون که این صفحه دوره آموزشی یادگیری ماشین را مشاهده می کنید احتمالا در حین جستجو در اینترنت با واژه هایی مانند هوش مصنوعی (AI)، علم داده (Data Science)، داده کاوی (Data Mining)، تحلیل داده (Data Analysis)، یادگیری ماشین (Machine Learning) برخورد کرده اید و این سوال براتون مطرح شده که این واژه ها چه مفهومی داشته و چه ارتباطی یا یادگیری ماشین دارند؟ در سایت ها و کانال های مختلف شبکه های اجتماعی راجع به متخصص علم داده (Data Scientist) و مهندس داده (Data Engineer) شنیده اید و یا در سایت های کاریابی شرکت هایی را دیده اید که دنبال استخدام متخصصان علم داده هستند. و ممکن است این سوال براتون ایجاد شده که چه ارتباطی بین هوش مصنوعی، علم داده، داده کاوی،تحلیل داده و دوره آموزشی یادگیری ماشین با پایتون وجود دارد. شما بعد از گذراندن دوره دوره آموزش یادگیری ماشین ماشین (Machine Learning) با پایتون در آموزشگاه تحلیل داده، با این مفاهیم آشنا شده و مهارت های مورد نیاز یک متخصص علم داده را یاد می گیرید و می توانید در زمینه های کاری مخصصین علم داده براحتی وارد بازار کار شوید.

دوره ماشین لرنینگ

آیا یادگیری مهارت ماشین لرنینگ در سال 2025 ضروری است؟

روندهای مشاهده شده از پیشرفت های هوش مصنوعی نشان می دهد که در سال های آینده بسیاری از شغل های موجود حذف شده و توسط ربات ها انجام می شوند. هم اکنون نیز مدیاهای مختلف پر از اخبار پیشرفت های یادگیری ماشین و هوش مصنوعی هستند. در حال حاضر کسب و کارهای بسیاری بدنبال استخدام افراد متخصص در حوزه علم داده (Data Scientist) هستند و با توسعه روز افزون کاربردهای مباحث علم داده و یادگیری ماشین در صنعت و اقتصاد، استقبال کسب و کارها از متخصصان این حوزه مدام در حال بیشتر شدن است. بنابراین یادگیری ماشین (Machine Learning) در سال 2025 و سال های آتی لازم و ضروری است.

یادگیری ماشین چیست؟

یادگیری ماشین شاخه ای از هوش مصنوعی (artificial intelligence) و علوم کامپیوتر است که بر استفاده از داده‌ها و الگوریتم ‌ها برای تقلید از روشی که انسان‌ها یاد می‌گیرند تمرکز دارد و به تدریج دقت یادگیری را بهبود می‌بخشد. یادگیری ماشین یکی از مهمترین زمینه های حوزه رو به رشد علم داده (Data Science) است. از طریق استفاده از روش های آماری، الگوریتم ها برای طبقه بندی یا پیش بینی آموزش داده می شوند و بینش های کلیدی را در پروژه های داده کاوی (Data mining) آشکار می کنند. این بینش‌ها متعاقباً باعث تصمیم سازی در کاربردهای مختلف و کسب‌ و کارها شده و به طور ایده‌آل بر معیارهای کلیدی رشد تأثیر می‌گذارند. فرآیند یادگیری با مشاهدات یا داده هایی مانند مثال ها، تجربه مستقیم یا آموزش آغاز می شود تا الگوهایی در داده ها پیدا شود و بر اساس داده های گذشته و برمبنای الگوهای استخراج شده، در آینده تصمیمات بهتری گرفته شود. هدف اصلی این است که کامپیوترها به طور خودکار بدون دخالت یا کمک انسان یاد بگیرند و بر اساس آن اقدامات را تنظیم کنند.

برخی از روش های یادگیری ماشین

الگوریتم های یادگیری ماشین اغلب در دو دسته یادگیری با نظارت و یادگیری بدون نظارت دسته بندی می شوند.

  1. الگوریتم های یادگیری ماشین با نظارت نظارت از داده های برچسب دار گذشته یاد گرفته و از طریق آن رخدادهای آینده را پیش بینی می کنند. با شروع از تجزیه و تحلیل یک مجموعه داده آموزشی که برچسب آنها مشخص است، الگوریتم یادگیری ماشین یک تابع استنباط شده برای پیش بینی مقادیر خروجی تولید می کند. این سیستم قادر است پس از آموزش کافی، برچسبی را برای هر ورودی جدید ارائه دهد. الگوریتم یادگیری همچنین می تواند خروجی خود را با خروجی صحیح و مورد نظر مقایسه کند و خطاها را بیابد تا مدل را مطابق با آن اصلاح کند.
  2. در مقابل، الگوریتم‌های یادگیری ماشینی بدون نظارت زمانی استفاده می‌شوند که اطلاعات مورد استفاده برای آموزش نه طبقه‌بندی شده و نه برچسب‌گذاری شده باشد. یادگیری بدون نظارت بررسی می کند که چگونه سیستم ها می توانند تابعی را برای توصیف یک ساختار پنهان از داده های بدون برچسب استنتاج کنند. این سیستم خروجی درستی را پیدا نمی‌کند، اما داده‌ها را کاوش می‌کند و می‌تواند استنتاج‌هایی را از مجموعه داده‌ها برای توصیف ساختارهای پنهان از داده‌های بدون برچسب استخراج کند.
  3. الگوریتم‌های یادگیری ماشین نیمه‌نظارت‌ شده جایی بین یادگیری نظارت‌شده و بدون نظارت قرار می‌گیرند، زیرا از داده‌های برچسب‌دار و بدون برچسب برای آموزش استفاده می‌کنند. معمولاً مقدار کمی از داده‌های برچسب‌گذاری شده و مقدار زیادی از داده‌های بدون برچسب هستند. سیستم هایی که از این روش استفاده می کنند می توانند دقت یادگیری را به میزان قابل توجهی بهبود بخشند. معمولاً یادگیری نیمه نظارتی زمانی انتخاب می‌شود که برچسب‌گذاری داده‌ها نیازمند افراد متخصص یا منابع مرتبط باشند، به عبارت دیگر لازم باشد که بطور دستی الگوریتم یادگیری ماشین را آموزش دهند.
  4. الگوریتم های یادگیری ماشینی تقویتی یک روش یادگیری است که با تولید کنش ها و کشف خطاها یا پاداش ها، با محیط خود در تعامل است. جستجوی آزمون و خطا و پاداش تاخیری مرتبط ترین ویژگی های یادگیری تقویتی هستند. این روش به ماشین‌ها و عامل‌های نرم‌افزار اجازه می‌دهد تا به‌طور خودکار رفتار ایده‌آل را در یک زمینه خاص تعیین کنند تا عملکرد آن را به حداکثر برسانند. بازخورد پاداش ساده برای عامل نرم افزاری لازم است تا بفهمد کدام عمل بهترین است. این سیگنال به عنوان سیگنال تقویتی شناخته می شود.

چرا یادگیری ماشین مهم است؟

چرا از یادگیری ماشینی استفاده کنیم؟ اهمیت یادگیری ماشینی به دلیل حجم فزاینده و تنوع داده ها، دسترسی و مقرون به صرفه بودن توان محاسباتی، و در دسترس بودن اینترنت پرسرعت، در حال افزایش است. این عوامل دگرگونی دیجیتال این امکان را برای فرد ایجاد می کند که به سرعت و به طور خودکار مدل هایی را توسعه دهد که می توانند به سرعت و با دقت مجموعه داده های فوق العاده بزرگ و پیچیده را تجزیه و تحلیل کنند.

موارد استفاده زیادی وجود دارد که می‌توان از یادگیری ماشینی برای کاهش هزینه‌ها، کاهش خطرات و بهبود کیفیت کلی زندگی از جمله توصیه محصولات یا خدمات، شناسایی نقض‌های امنیت سایبری و فعال کردن خودروهای خودران استفاده کرد. با دسترسی بیشتر به داده ها و قدرت محاسباتی، یادگیری ماشینی هر روز فراگیرتر می شود و به زودی در بسیاری از جنبه های زندگی انسان ادغام خواهد شد.

کاربردهای یادگیری ماشین

  1. مراقبت های بهداشتی: گسترش حسگرها و دستگاه‌های پوشیدنی که همه چیز را از ضربان نبض و گام‌های پیاده‌روی گرفته تا سطح اکسیژن و قند و حتی الگوهای خواب نظارت می‌کنند، حجم قابل‌توجهی از داده‌ها را تولید کرده است که پزشکان را قادر می‌سازد تا سلامت بیماران خود را در زمان واقعی ارزیابی کنند. یک الگوریتم یادگیری ماشین تومورهای سرطانی را در ماموگرافی تشخیص می دهد. دیگری سرطان پوست را شناسایی می کند. سومی می تواند تصاویر شبکیه را برای تشخیص رتینوپاتی دیابتی تجزیه و تحلیل کند.
  2. دولت: سیستم‌هایی که از یادگیری ماشینی استفاده می‌کنند، مقامات دولتی را قادر می‌سازند تا از داده‌ها برای پیش‌بینی سناریوهای بالقوه آینده و سازگاری با شرایط به سرعت در حال تغییر استفاده کنند. یادگیری ماشین می تواند به بهبود امنیت سایبری و اطلاعات سایبری، حمایت از تلاش های ضد تروریسم، بهینه سازی آمادگی عملیاتی، مدیریت لجستیک، و تعمیر و نگهداری پیش بینی، و کاهش نرخ شکست کمک کند.
  3. بازاریابی و فروش: یادگیری ماشینی حتی بخش بازاریابی را نیز متحول کرده است، زیرا بسیاری از شرکت‌ها با پیاده سازی هوش مصنوعی (AI) و یادگیری ماشین (ML) رضایت مشتری را تا بیش از 10 درصد افزایش و ارتقا دادهاند. در واقع، طبق گفته فوربیس، «57 درصد از مدیران شرکت معتقدند که مهمترین مزیت رشد هوش مصنوعی و یادگیری ماشین (ML)، بهبود تجربیات و پشتیبانی مشتری خواهد بود».
  4. سایت‌های تجارت الکترونیک و رسانه‌های اجتماعی اجتماعی از یادگیری ماشین (ML) برای تجزیه و تحلیل تاریخچه خرید و جستجوی شما استفاده می‌کنند و بر اساس عادت‌های گذشته‌تان، کالاهایی را برای خرید توصیه می‌کنند. بسیاری از کارشناسان این نظریه را مطرح می‌کنند که آینده خرده‌فروشی توسط هوش مصنوعی و یادگیری ماشین (ML) هدایت می‌شود، زیرا سیستم‌ها در جمع‌آوری، تجزیه و تحلیل و استفاده از داده‌ها برای شخصی‌سازی تجربیات خرید افراد و توسعه کمپین‌های بازاریابی هدفمند و سفارشی‌سازی شده ماهرتر می‌شوند.
  5. حمل و نقل: کارایی و دقت، کلید سودآوری در این بخش است. توانایی پیش بینی و کاهش مشکلات احتمالی نیز وجود دارد. تحلیل داده‌ها و عملکردهای یادگیری ماشین (ML) کاملاً با مشاغل در بخش‌های تحویل، حمل‌ونقل عمومی و حمل‌ونقل بار هماهنگ است. یادگیری ماشین (ML) از الگوریتم‌هایی برای یافتن عواملی استفاده می‌کند که به طور مثبت و منفی بر موفقیت زنجیره تأمین تأثیر می‌گذارند و یادگیری ماشین را به یک مؤلفه مهم در مدیریت زنجیره تأمین تبدیل می‌کند.
  6. در لجستیک، یادگیری ماشین (ML) توانایی زمان‌بندی‌ها را برای بهینه‌سازی فرآیندهای انتخاب حامل، رتبه‌بندی، مسیریابی و فرآیندهای کنترل کیفیت (QC) تسهیل می‌کند که باعث صرفه‌جویی در هزینه و بهبود کارایی می‌شود. توانایی آن در تجزیه و تحلیل هزاران نقطه داده به طور همزمان و اعمال الگوریتم ها سریعتر از هر انسانی، یادگیری ماشین (ML) را قادر می سازد تا مشکلاتی را که افراد هنوز شناسایی نکرده اند، حل کند. یادگیری ماشین (ML) به شرکت ها کمک کرده است راه حل های لجستیکی را بهبود بخشند که شامل مدیریت دارایی، زنجیره تامین و موجودی است. همچنین با اندازه‌گیری در دسترس بودن، عملکرد و کیفیت تجهیزات مونتاژ، نقش کلیدی در افزایش اثربخشی کلی تجهیزات (OEE) دارد.
  7. خدمات مالی: بینش های ارائه شده توسط یادگیری ماشین (ML) در این صنعت به سرمایه گذاران اجازه می دهد فرصت های جدید را شناسایی کنند یا بدانند چه زمانی باید معامله کنند. داده کاوی مشتریان پرخطر را مشخص می کند و به ناظران سایبری برای یافتن و کاهش نشانه های کلاهبرداری اطلاع می دهد. یادگیری ماشین (ML) می تواند به کالیبره کردن پرتفوی های مالی یا ارزیابی ریسک وام و بیمه نامه کمک کند. آینده هوش مصنوعی و یادگیری ماشین (ML) در این صنعت شامل توانایی ارزیابی صندوق های پوشش ریسک و تحلیل حرکت بازار سهام برای ارائه توصیه های مالی است.
  8. نفت و گاز: یادگیری ماشین (ML) و AI در حال حاضر برای یافتن منابع انرژی جدید و تجزیه و تحلیل ذخایر معدنی در زمین، پیش‌بینی خرابی سنسور پالایشگاه و ساده‌سازی توزیع نفت برای افزایش کارایی و کاهش هزینه‌ها کار می‌کنند. یادگیری ماشین (ML) با استدلال مبتنی بر مورد، مدل‌سازی مخزن و اتوماسیون کف حفاری، صنعت را متحول می‌کند. و بالاتر از همه، یادگیری ماشینی به ایمن تر کردن این صنعت خطرناک کمک می کند.
  9. ساخت و تولید: یادگیری ماشینی نیز برای صنعت ساخت و تولید وسیع غریبه نیست. هدف بهبود عملیات از مفهوم سازی تا تحویل نهایی، کاهش قابل توجه نرخ خطا، بهبود تعمیر و نگهداری پیشگیرانه است.


دوره یادگیری ماشین

یادگیری ماشین چگونه کار می کند؟

چهار مرحله کلیدی وجود دارد که باید هنگام ایجاد یک مدل یادگیری ماشین دنبال کنید.

  1. انتخاب و آماده سازی دیتاست آموزش

    داده های آموزش داده هایی هستند که الگوریتم های یادگیری ماشین از آن داده ها برای تنظیم پارامترهای مدل یادگیری ماشین استفاده می کنند. داده های آموزش برخی اوقات دارای برچسب هستند بدین معنی که از الگوریتم های طبقه بندی برای آموزش و پیش بینی برچسب داده استفاده خواهیم کرد. ممکن است داده های آموزش دارای برچسب نباشند در این حالت از الگوریتم های خوشه بندی برای کشف الگور و ساختار پنهان بین نمونه ها و خوشه بندی آنها استفاده خواهیم کرد.
    برای داده های برچسب گذاری شده، داده ها باید به یک زیر مجموعه آموزشی و یک زیر مجموعه تست تقسیم شوند. اولی برای آموزش مدل و دومی برای ارزیابی اثربخشی مدل و یافتن راه‌هایی برای بهبود آن استفاده می‌شود.

  2. انتخاب یک الگوریتم یادگیری ماشین برای آموزش روی مجموعه داده های آموزش

    نوع الگوریتمی که برای آموزش انتخاب می شود بستگی به موارد زیر دارد:

    1. آیا کاربرد الگوریتم یادگیری ماشین برای پیش بینی با دسته بندی است یا الگوریتم یادگیری ماشین برای کاهش ابعاد یا خوشه بندی استفاده می شود؟
    2. برای داده های برچسب دار، برچسب داده پیوسته است یا گسسته
    3. اندازه دیتاست چقدر است؟
    4. طبیعت مسئله ای که مدل یادگیری ماشین دنبال حل آن است.

    برای کاربردهای پیش بینی یا طبقه بندی، باید از الگوریتم های بانظارت شامل الگوریتم های طبقه بندی یا رگرسیون باید استفاده شود. برای برچسب های پیوسته الگوریتم های رگرسیون و برای برچسب های گسسته الگوریتم های طبقه بندی کاربرد دارند. در مورد داده های بدون برچسب، احتمالا باید از الگوریتم های خوشه بندی مانند الگوریتم k-means استفاده شود. برخی برخی الگوریتم ها مانند الگوریتم های یادگیری عنیق برای هر دو داده برچسب دار و بدون برچسب به کار برده می شوند.

  3. الگوریتم را آموزش داده تا مدل ساخته شود

    آموزش الگوریتم شامل تنظیم یا تیون کردن متغییرها و پارامترهای مدل یادگیری ماشین است تا زمانی که بهترین دقت پیش بینی را داشته باشیم. آموزش الگوریتم یادگیری ماشین معمولا یک فرآیند تکراری است که روش های بهینه سازی متعددی استفاده می کند و برای بهینه سازی نیازی به مداخله انسان نیست.

  4. استفاده از مدل و بهبود آن

    آخرین مرحله استفاده از مدل برای پیش بینی داده های جدید و تغذیه مدل با داده های جدید است. با ورود اطلاعات جدید به الگوریتم حجم داده های آموزش بیشتر شده و در نتیجه خطای الگوریتم کاهش پیدا می کند. مانند خودروهای خود¬ران که روزانه در محیط واقعی با داده های جدیدی که در جاده است روبرو می شوند.

دوره آموزش یادگیری ماشین

چرا پروژه های یادگیری ماشین را با زبان برنامه نویسی پایتون (Python) انجام می دهیم؟

نرم افزارهای زیادی برای حوزه های یادگیری ماشین و داده کاوی توسعه داده شده اند که از جمله معروفترین آنها می توان به RapidMiner, Weka, KNIME, MATLAB, R اشاره کرد تمامی این نرم فزارها یک نقص یا کمبود بزرگی دارند و آن ناتوانایی آنها در تحلیل دیتاست های حجیم است.

وقتی حجم داده های بزرگ می شود این نرم افزارها توانایی پردازش داده های با حجم بزرگ را ندارند. بخاطر همین استقبال چندانی از این نرم افزارها در فضای واقعی کسب و کارها وجود ندارد. زبان برنامه نویسی پایتون علاوه بر اینکه این نقص را ندارد، انعطاف پذیری و قابلیت های فراوانی را در اختیار دانشمندان علم داده (Data Scientist) قرار می دهد.

پایتون یک زبان برنامه نویسی بسیار ساده ای است و یادگیری آن خیلی آسان است. همین سادگی و آسانی در کنار قابلیت های مختلف باعث شده پایتون اولین انتخاب دانشمندان علم داده و کسب وکارها برای پروژه های یادگیری ماشین (Machine Learning) باشد.

آموزش ماشین لرنینگ
دوره یادگیری ماشین
دوره آموزش یادگیری ماشین
آموزش ماشین لرنینگ

توضیحاتی راجع به دوره یادگیری ماشین

برای شرکت در این دوره آموزشی لازم است که با برنامه نویسی در محیط پایتون آشنا باشید.

تئوری مطالب هر بخش در ابتدای هر درس گفته می شود و سپس در محیط پایتون به صورت عملی الگوریتم های مربوطه پیاده سازی خواهند شد.

شرکت کنندگانی که در این دوره ثبت نام می کنند، در محیطی دوستانه و در کنار یکدیگر، به کمک مدرس دوره و با روش تعاملی تمامی پروژه ها و برنامه های نوشته شده در کلاس را "خودشان" پیاده سازی می کنند.

پروژه های دوره یادگیری ماشین
  • تشخیص دیابت
  • پیش بینی نتایج مسابقات فوتبال
  • پیش بینی قیمت خانه
  • پیش بینی قیمت ارز
  • پیش بینی شاخص بورس
  • تشخیص دست خط خودتان
  • بررسی مسابقات kaggle و انجام یکی از پروژه های آن
  • خوشه بندی مشتریان بانک
  • پروژه اصلی پایان دوره

مخاطبین دوره یادگیری ماشین

  1. برنامه نویسان و کاربران سیستم‌ها و راهکارهای داده کاوی و تحلیل داده
  2. توسعه دهندگان سامانه های هوش تجاری BI و Data Mining
  3. محققان، پژوهشگران و کارشناسان در حوزه‌ی علم داده
  4. کارشناسان و علاقه مندان به داده کاوی که می خواهند پروژه دانشجویی یا پروژه سازمانی خود را به کمک راهکارهای هوش مصنوعی اجرا و پیاده سازی کنند

اهداف دوره آموزشی یادگیری ماشین

  1. آموزش نحوه پیاده سازی پروژه های داده کاوی و یادگیری ماشین در پایتون بصورت کاربردی
  2. آموزش ریاضیات و تئوری الگوریتم های یادگیری ماشین
  3. آموزش کتابخانه numpy برای کار با آرایه ها و کاربردها پیش پردازش داده
  4. آموزش کتابخانه pandas برای کار با دیتاست ها و کاربردها پیش پردازش داده
  5. آموزش کتابخانه Matplotlib و Seaborn برای رسم نمودار در پایتون
  6. آموزش نحوه پیاده سازی الگوریتم ها بصورت شیء گرا در پایتون
  7. آموزش الگوریتم های نظارت شده و استفاده از مدل های آماده scikit learn
  8. آموزش الگوریتم های بدون ناظر و استفاده از مدل های آماده scikit learn
  9. آموزش روش های کاهش ابعاد
  10. آموزش تکنیک ها feature selection
  11. آموزش روش ها اعتبارسنجی و ارزیابی مدل های یادگیری ماشین
  12. آموزش ارزیابی داده های نامتوازن (imbalanced)
سوال

بخش اول: مروری بر پیشنیاز های یادگیری ماشین

در این بخش با مقدمات یادگیری ماشین (Machine learning) آشنا خواهیم شد. در ابتدا با مفاهیم علم داده (Data science)، هوش مصنوعی (Artificial intelligence)، داده کاوی (Data mining) ، یادگیری ماشین (Machine learning) و سایر مفاهیم مطرح در این حوزه آشنا می شویم و سپس ارتباط این مفاهیم با یکدیگر را بررسی می کنیم.

و بعد از آن با انواع روش های یادگیری ماشین آشنا شده و برخی از پیشنیازهای ورود به این دوره را شامل کتابخانه های numpy, pandas, matplotlib مرور خواهیم کرد.

(درصورتی که دانشجویان با این کتابخانه ها آشنا نباشند این کتابخانه ها بطور کامل تدریس خواهند شد.)

برای تثبیت مفاهیم این بخش تمرینات متعدد کلاسی و تکلیف های منزل تعریف می شود.

مهمترین سرفصل های این بخش عبارتند از:

  1. آموزش کتابخانه numpy

    • ساخت آرایه در numpy
    • Indexing, Slicing, Iterating
    • آرایه های چند بعدی
    • دسترسی به عناصر آرایه با استفاده از numpy و اسلایسینگ
    • تفاوت copy و view در آرایه numpy
    • آموزش تابع reshape در numpy
    • اتصال آرایه‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ها در numpy | تابع concatenate
    • تفکیک یک آرایه به چند آرایه
    • جست و جو و مرتب سازی آرایه در numpy
  2. کتابخانه pandas

    • معرفیseries و بررسی تفاوت آن با آرایه و دیکشنری
    • آموزش ساخت سری در کتابخانه pandas
    • دیتافریم‌ (DataFrame) در کتابخانه Pandas
    • آموزش ساخت Data Frame در Pandas
    • ایندکس در پانداس
    • دسترسی به المانهای دیتافریم (DataFrame) و slicing در Pandas
    • ترکیب دیتافرم ها Concat and Append
    • آموزش Groupby, Pivote در Pandas
    • اکتشاف دیتاست EDA
  3. آموزش کتابخانه Matplotlib و Seaborn برای رسم نمودار در پایتون

    • معماری Matplotlib
    • Pyplot
    • ترسیم نمودارهای مختلف (Line chart, Pie chart, Scatter plot, …)
    • اضافه کردن جزئیات بیشتر به نمودارها
    • ترسیم چند نمودار باهمدیگر
بخش دوم: مقدمه ای بر یادگیری ماشین و کاربرد آن

در بخش مقدمه ای بر یادگیری ماشین ریاضیات اولین مدل یادگیری ماشین را تجزیه و تحلیل کرده و اولین برنامه یادگیری ماشین را بطور دستی پیاده سازی می کنیم. بعد از معرفی دیتاست های MNIST و IRIS مدل پیاده سازی شده را با این دیتاست ها آموزش داده و نتیجه را تحلیل می کنیم.

مهمترین سرفصل های بخش مقدمه ای بر یادگیری ماشین عبارتند از:

  • مفاهیم علم داده، هوش مصنوعی، داده کاوی، یادگیری ماشین، یادگیری عمیق، شبکه های عصبی مصنوعی
  • برخی از کاربردهای علم داده
  • آینده شغلی و حرفه ای دانشجویان بعد از تکمیل این دوره
  • یادگیری با ناظر
  • یادگیری بدن ناظر
  • معرفی روش های Classification
  • معرفی رگرسیون
  • معرفی دیتا ست iris
  • بررسی دقیق روابط ریاضی الگوریتم Perceptron به عنوان اولین الگوریتم یادگیری ماشین
  • پیاده سازی الگوریتم Perceptron بصورت شیء گرا بدون استفاده از scikit-learn
    1. نوشتن کلاس Perceptron
    2. برنامه نویسی تابع fit
    3. برنامه نویسی تابع محاسبه خطا
    4. برنامه نویسی تابع Predict
    5. برنامه نویسی تابع Net-input
  • خواندن دیتاست iris و جداسازی برچسب و تفکیک داده های آموزش و تست
  • آموزش مدل برنامه نویسی شده با دیتاست iris و پیش بینی داده های تست و محاسبه خطا
  • معرفی دیتاست MNIST
  • تمرین کلاسی : خواندن دیتاست و جداسازی برچسب و تفکیک داده های آموزش و تست
  • تمرین کلاسی خواندن دیتاست و جداسازی برچسب و تفکیک داده های آموزش و تست
  • معرفی کتابخانه openCV برای خواندن عکس
  • تمرین منزل: در یک برگه کاغذ با دست خط خودتان اعداد 0 تا 9 را نوشته و با استفاده از مدل Perceptron که با داده های MNIST فیت شده اعداد نوشته شده را تعیین کنید.
  • تعریف پروژه های دوره آموزشی
بخش سوم: یادگیری با نظارت (مدل های Classification)

در بخش یادگیری با نظارت، مدلهای یادگیری با ناظر که برای طبقه بندی کاربرد دارند تدریس می شود.

ابتدا چندتا از مدلها با دیتاست های آماده scikit-learn تدریس می شود سپس برای کار با داده های واقعی مباحث پیش پردازش (preprocessing) دیتاست و تحلیل اکتشافی داده ها (Exploratory Data Analysis) و همچنین انواع روشهای نرمالسازی (Normalization) و استانداردسازی (Standardization)تدریس شده و بعد از آن برای ادامه فعالیت های کلاسی از دیتاست های واقعی استفاده می شود

فرآیند کار به این صورت است که ابتدا دیتاست های واقعی پیش پردازش شده و به دیتاست clean تبدیل می شوند، بعد در صورت لزوم داده ها نرمال یا استاندارد می شوند، سپس مدل های طبقه بندی را با دیتاست های واقعی آموزش داده و تست می کنیم.

در این بخش تمرینات و پروژه های متعدد با داده های واقعی خواهیم داشت.

موضوعات مهم که در این بخش تدریس می شود عبارتند از:

  • مدل Perceptron
    • معرفی کتابخانه scikit-learn
    • آموزش توابع تقسیم کننده دیتاست (train-test-split)به مجموعه های train , test
    • آموزش کتابخانه mlxtend و معرفی برخی از ابزارهای آن
    • آموزش ماژول ترسیم کننده دیتاست قبل و بعد از آموزش مدل (plot-decision-region) از کتابخانه mlxtend
    • آموزش مدل با دیتاست نمونه و تست
    • بیان نقاط ضعف و نقاط قوت perceptron و کاربردهای آن
  • مدل Logistic regression
    • معرفی مدل و بیان ریاضیات آن
    • آموزش بکارگیری مدل و استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با مدل Logistic regression
    • بررسی مقالات روز که از مدل Logistic regression استفاده کرده باشند و پیاده سازی یکی از آنها
    • تعریف پروژه برای کار با این مدل
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل Logistic regression
  • مفاهیم Overfitting & Underfitting
    • تعریف مسئله
    • تشریح دلیل رخ دادن بیش برازش و کم برازش
    • چگونگی تشخیص Overfitting & Underfitting
    • خطاهای مربوط به bias and variance problems
    • شیوه برخورد و مقابله با Overfitting & Underfitting
    • مفاهیم و ریاضیات Regularization
    • مفاهیم Feature selection
    • انجام پروژه در رابطه با تابع جریمه و انواع روش های انتخاب ویژگی و بررسی نتایج و مقایسه آنها
    • بررسی مقالات روز در رابطه با موضوع
  • آموزش دسته‌بندی‌کننده بیز ساده (مدل Naive Bayes Classifier)
    • آموزش Naive Bayes Classifier و آموزش ریاضیات آن
    • آموزش بکارگیری Naive Bayes Classifier و استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با مدل Naive Bayes Classifier
    • بررسی مقالات روز که از مدل Naive Bayes Classifier استفاده کرده باشند و پیاده سازی یکی از آنها
    • تعریف پروژه برای کار با Naive Bayes Classifier
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل Naive Bayes Classifier
  • آموزش درخت تصمیم (مدل Decision Trees)
    • آموزش مدل Decision Trees و آموزش ریاضیات آن
    • آموزش بکارگیری مدل Decision Trees و استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با مدل Decision Tree
    • بررسی مقالات روز که از مدل Decision Tree استفاده کرده باشند و پیاده سازی یکی از آنها
    • تعریف پروژه برای کار با مدل Decision Trees
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل Decision Tree
  • الگوریتم جنگل تصادفی (Random Forest)
    • آموزش مدل Random Forest و آموزش ریاضیات آن
    • آموزش بکارگیری مدل Random Forest و استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با مدل Random forests
    • بررسی مقالات روز که از مدل Random forests استفاده کرده باشند و پیاده سازی یکی از آنها
    • تعریف پروژه برای کار با این مدل
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل Random forests
  • آموزش نرمالسازی (Normalization) و استانداردسازی (Standardization)
    • بیان مساله و دلیل نیاز به هم مقیاس کردن داده ها
    • ریاضیات روش استاندارد سازی
    • استانداردسازی با scikit-learn
    • روش نرمالسازی min-max
    • Min-max در scikit-learn
    • معرفی سایر روش های نرمالسازی و بیان مزایا و معایب و کاربردهای هر یک
  • آموزش ماشین های بردار پشتیبان (SVM)
    • آموزش ماشین های بردار پشتیبان (SVM)و بیان ریاضیات آن
    • آموزش بکارگیری مدل SVMو استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با مدل SVM
    • بررسی مقالات روز که از مدل SVM استفاده کرده باشند و پیاده سازی یکی از آنها
    • معرفی soft margin svm
    • تعریف پروژه برای کار با این مدل
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل SVM
  • آموزش توابع کرنل در ماشین های بردار پشتیبان (Kernelized Support vector machines)
    • تشریح مسائل و مشکلات دیتاست هایی که کلاس های آن بطور خطی تفکیک پذیر نیستند.
    • معرفی تابع کرنل و بیان ریاضیات
    • شیوه استفاده از توابع کرنل در SVM
    • معرفی انواع کرنل ها، مزایا، محدودیت ها و کاربردها
    • تعریف و حل تمرین های کاربردی
    • بررسی مقالات روز در رابطه با تاثیر کرنل های مختلف بر دقت مدل
    • تعریف پروژه
  • آموزش مدل نزدیکترین همسایه KNN (K-nearest Neighbors)
    • آموزش مدل KNN و بیان ریاضیات آن
    • آموزش بکارگیری مدل KNN و استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با مدل KNN
    • بررسی مقالات روز که از مدل KNN استفاده کرده باشند و پیاده سازی یکی از آنها
    • تعریف پروژه برای کار با این مدل
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل KNN
بخش چهارم: اکتشاف، پاکسازی و پیش پردازش داده ها (EDA, Preprocessing, Data cleaning)

قبل از اینکه بخواهیم از داده های واقعی در هریک از مدل های یادگیری ماشین استفاده کنیم لازم است دیتاست موجود را بخوبی درک کنیم.

درک دیتاست کمک می کند تا مختصص علم داده بهترین تصمیم را در زمینه انتخاب مدل مناسب برای پیش بینی، شیوه اعتبارسنجی و استخراج نتایج و تعیین خروجی های مناسب، داشته باشد.

شکل دیتاست، نوع داده ها و ویژگی ها، شکل توزیع داده ها، بالانس بودن یا نبودن، همبستگی بین ویژگی ها و برچسب ، کشف داده های پرت و ... از جمله مواردی هستند که در اکتشاف دیتاست باید به دقت بررسی شوند

در این بخش ابتدا با روش های اکتشاف دیتاست آشنا شده و تمرین هایی با دیتاست های واقعی انجام می دهیم.

بعد از اکتشاف دیتاست، لازم است داده ها را برای آموزش مدل آماده کنیم. باید تصمیم بگیریم که چه برخوردی با داده های پرت داشته باشیم، داده های miss شده را باید مدیریت کنیم، فرمت داده های از نوع طبقه بندی را باید متناسب با مدل انتخاب شده برای آموزش اصلاح کنیم و بسیاری از عملیات دیگر که با آنها در مبحث پاکسازی و پیش پردازش داده ها آشنا شده و دیتاست های اکتشاف شده را پیش پردازش می کنیم.

سرفصل های مهم این بخش عبارتند از:

  • اکتشاف داده (Exploratory Data Analysis)
    • مصورسازی تک متغییره
    • مصورسازی چند متغییره
    • مصورسازی و تشخیص شکل توزیع
    • داده های پرت، منشا آنها و شیوه تشخیص
    • همبستگی بین ویژگی ها و نمودار Heat map
  • پاکسازی و پیش پردازش (Preprocessing, Data cleaning)
    • داده‌های گمشده یا از دست رفته (Missing Values) و راهکارهای مقابله با آن‌ها
    • مواجهه با داده های از نوع طبقه بندی Categorical data))
    • انتخاب ویژگی های مرتبط با هدف یادگیری
    • Encoding class labels
بخش پنجم: کاهش ابعاد

در شرایط واقعی بسیار محتمل است که با دیتاست هایی روبرو شویم که هزاران ویژگی داشته باشند. پردازش دیتاستی با این ابعاد، هزینه محاسباتی بسیاری دارد و گاهی ممکن است ما را دچار overfitting کند. براحتی می توانیم با بهره گیری از تکنیک هایی مانند PCA و LDA ابعاد مسئله را کاهش دهیم و ضمن عبور از overfitting ، هزینه های محاسباتی را نیز کاهش دهیم. هرچند که ممکن است، خطای پیش بینی اندکی افزایش پیدا کند.

در این بخش به موضوعات زیر می پردازیم:

  • تکنیک کاهش ابعاد برای داده های غیر نظارت شدهPrincipal Component Analysis (PCA)
    • آموزش PCA و بیان ریاضیات آن
    • آموزش بکارگیری PCA و استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با PCA
    • بررسی مقالات روز در رابطه با تاثیر PCA در پروژه های یادگیری ماشین
    • تعریف پروژه برای کار با PCA
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل PCA
  • تکنیک کاهش ابعاد برای داده های نظارت شدهLinear Discriminant Analysis (LDA)
    • معرفی LDA و بیان ریاضیات آن
    • آموزش بکارگیری LDA و استفاده از آن برای مسائل پیش بینی
    • تعریف و حل تمرین های کاربردی با LDA
    • بررسی مقالات روز در رابطه با تاثیر LDA در پروژه های یادگیری ماشین
    • تعریف پروژه برای کار با LDA
    • بیان نقاط ضعف و نقاط قوت و کاربردهای مدل LDA
  • انواع روش های Feature Selection
    • تکنیک Feature importance RF
    • تکنیک Brute force
    • تکنیک Boruta
بخش ششم: آموزش کار با داده های نامتوازن (imbalanced)

تا کنون هر دیتاستی بررسی کردیم همه بالانس بودند یعنی نسب اعضای هر کلاس نزدیک به هم بودند در بخش کار با داده های نامتوازن با دیتاست هایی کار خواهیم کرد اختلاف فاحشی بین نسبت اعضای کلاس ها وجود دارد.

این نوع دیتاست ها غیر بالانس هستند یعنی بالانسی بین اعضای کلاس ها وجود ندارد. شیوه اعتبار سنجی و ارزیابی مدل های باناظر در داده های غیربالانس متفاوت است. در اینجا با دیتاست های غیربالانس آشنا شده و روش های مختلف اعتبارسنجی و ارزیابی مدل ها را بررسی می کنیم.

در این مورد با مفاهیم ماتریس درهم ریختگی، صحت (Accuracy) ، دقت (Precision)، recall ، F1_score, ROC و AUC آشنا خواهیم شد.

مهمترین سرفصل های این بخش در ادامه بیان شده است.

  • دیتاست غیر بالانس و ویژگی های آن
    • در واقعیت چه نوع دیتاست هایی غیر بالانس هستند
    • دانلود چند دیتاست واقعی غیربالانس برای پروژه این بخش
    • تعریف پروژه برای اکتشاف، پاکسازی و پیش پردازش دیتاست های دانلود شده
  • ماتریس درهم ریختگی (confusion matrix)
    • شیوه آنالیز و تحلیل ماتریس
    • مثبت واقعی، مثبت کاذب، منفی واقعی، منفی کاذب
    • ترسیم ماتریس بصورت نمایش ماتریسی و مصورسازی بصورت Heat map
  • مفاهیم صحت (Accuracy) ، دقت (Precision)، recall
  • مفاهیم و شیوه ترسیم منحی ROC و تحلیل آن
  • AUC و شیوه محاسبه و نمایش
  • F1_score و تحلیل آن
  • تکنیک های بالانس کردن دیتاست
    • تکنیک های Oversampling
    • تکنیک های Undersampling
    • مقایسه تکنیک های مختلف
بخش هفتم: اعتبارسنجی، ارزیابی و بهبود مدل و تنظیم هایپرپارامترها

در بخش های قبلی، با الگوریتم‌های اصلی یادگیری ماشین برای طبقه‌بندی و نحوه شکل‌دهی داده‌هایمان قبل از وارد کردن آن‌ها به آن الگوریتم‌ها آشنا شدیم. اکنون زمان آن است که با تنظیم دقیق الگوریتم‌ها و ارزیابی عملکرد مدل‌ها، با بهترین روش‌های ساخت مدل‌های یادگیری ماشین آشنا شویم.

در بخش اعتبارسنجی، ارزیابی و بهبود مدل و تنظیم هایپرپارامترها ، یاد می گیریم چگونه عملکرد مدل های یادگیری ماشین را ارزیابی کنیم، با نحوه تشخیص مشکلات رایج الگوریتم های یادگیری ماشین و تنظیم دقیق این الگوریتم ها آشنا می شویم.

سرفصل های این بخش عبارتند از:

  • ساده کردن گردش کار با pipelines
    • لود کردن دیتاست سرطان پستان
    • ترکیب transformer ها و تخمین گرها در pipeline
  • استفاده از k-fold cross-validation برای عملکرد بهتر مدل
  • دیباگ کردن مدل با نمودارهای یادگیری و اعتبارسنجی
  • تشخیص مشکلات بایاس و واریانس با نمودار یادگیری
  • تشخیص overfitting, underfitting با استفاده از نمودار اعتبارسنجی
  • تنظیم دقیق مدل های یادگیری ماشین از طریق grid search
بخش هشتم: یادگیری ماشین ترکیبی (Ensemble Machine Learning)

در بخش یادگیری ماشین ترکیبی (Ensemble Machine Learning) یاد می گیریم که چطور الگوریتم های مختلف طبقه بندی را با یکدیگر ترکیب کنیم تا نتایج بهتری در پیش بینی داشته باشیم. بگونه ای که عملکرد مدل ترکیبی بهتر از عملکرد تک تک مدلها بصورت جداگانه باشد.

در این بخش با موضوعات پیش بینی براساس رای اکثریت، استفاده از bagging برای کاهش overfitting از طریق ایجاد دیتاست های تصادفی مشتق شده از داده های آموزش، ساخت مدلی قوی از ترکیب مدل های ضعیف که از اشتباه خود درس می گیرند، آشنا خواهیم شد.

مباحث مهمی که در این بخش تدریس می شوند عبارتند از:

  • آموزش مفاهیم و ریاضیات یادگیری با ensembles
  • آموزش ترکیب classifier ها با رای اکثریت
  • آموزش پیاده سازی رای اکثریت در پایتون
  • آموزش ارزیابی و تنظیم دقیق ensemble classifier
  • آموزش ساخت یک مدل ensemble با روش های bootstrap
  • تست مدل های ساخته شده با دیتاست واقعی
  • آموزش روش های boosting
بخش نهم: آموزش یادگیری با نظارت (مدل های Regression)

در بخش آموزش یادگیری با نظارت (مدل های Regression) مسائلی را بررسی می کنیم که برچسب پیوسته دارند. در این گونه مسائل دیگر طبقه بندی مطرح نیست و باید از مدل های رگرسیون برای پیش بینی استفاده کنیم.

پیش بینی قیمت یک خانه، پیش بینی میزان فروش سالانه یک شرکت، بررسی روابط بین متغیرها، ارزیابی روندها، کاربردهایی از این نوع مسائل هستند.

در این بخش ضمن بررسی مفاهیم رگرسیون و روابط ریاضی آن، موضوعاتی مانند اکتشاف و مصورسازی دیتاست مربوطه، رویکردهای متفاوت پیاده سازی مدل های رگرسیون خطی، آموزش مدلهای رگرسیون مقاوم به داده های پرت، ارزیابی مدل رگرسیون و حل مشکلات رایج و رگرسیون غیرخطی تدریس می شود.

در ادامه به برخی از مهمترین سرفصل ها اشاره شده است:

  • معرفی رگرسیون خطی
    • رگرسیون خطی ساده
    • رگرسیون خطی چند متغییره
  • اکتشاف دیتاست (EDA) خانه
    • مصورسازی ویژگی های مهم دیتاست
    • نمایش گسترده دیتاست برای کشف همبستگی بین فیچرها و تابع هدف
    • نمودار همبستگی ویژگی ها با heatmap
  • حل مسائل رگرسیون با استفاده از کاهش گرادیان (Gradient descent)
  • پیاده کردن ضرایب رگرسیون با استفاده از sklearn
  • برازش یک مدل رگرسیون قوی با استفاده از RANSAC
  • ارزیابی عملکرد مدلهای رگرسیون خطی
  • استفاده از روش های جریمه برای رگرسیون
  • رگرسیون برای داده های غیر خطی
  • مدلسازی رگرسیون غیرخطی برای دیتاست قیمت خانه
  • برخورد با روابط غیرخطی با استفاده از random forests
    • رگرسیون درخت تصمیم
    • رگرسیون random forests
بخش دهم: یادگیری غیر نظارت شده

در بخش های قبلی، از تکنیک‌های یادگیری نظارت‌شده برای ساخت مدل‌های یادگیری ماشینی استفاده کردیم، با استفاده از داده‌هایی که پاسخ از قبل مشخص بود و برچسب‌های کلاس قبلاً در داده‌های آموزشی ما موجود بودند، ماشین را آموزش دادیم تا برای داده های جدید برچسب سمپل را پیش بینی کند.

در این بخش، دنده‌ را عوض کرده و تجزیه و تحلیل خوشه‌ای را بررسی می‌کنیم، دسته‌ای از تکنیک‌های یادگیری بدون نظارت که به ما امکان می‌دهد ساختارهای پنهان در داده‌هایی که در آنها پاسخ درست را نمی‌دانیم، کشف کنیم.

هدف از خوشه‌بندی یافتن یک گروه‌بندی در داده‌ها است به طوری که سمپل های موجود در یک خوشه شباهت بیشتری به یکدیگر داشته باشند تا آنهایی که از خوشه‌های مختلف هستند. با توجه به ماهیت اکتشافی آن، خوشه بندی موضوعی هیجان انگیز است و در این بخش، با مفاهیم زیر آشنا خواهید شد که می تواند به ما در سازماندهی داده ها در ساختارهای معنادار کمک کند:

  • گروه بندی اشیاء براساس شباهت با استفاده ازK_means
  • K_means با استفاده از scikit-learn
  • راه هوشمندانه تر برای تعیین مراکز اولیه (K-means++)
  • خوشه بندی سخت یا نرم
  • استفاده از روش elbow برای پیدا کردن تعداد بهینه خوشه
  • کمی کردن کیفیت خوشه بندی از طریق silhouette plots
  • سازماندهی خوشه ها به عنوان یک درخت سلسله مراتبی
  • گروه بندی خوشه ها به روش پایین به بالا
  • انجام خوشه بندی سلسله مراتبی بر روی یک ماتریس فاصله
  • چسباندن dendrograms به یک heatmap
  • خوشه بندی Agglomerative
  • مکان یابی مناطق با تراکم بالا از طریق DBSCAN
  • مقایسه انواع الگوریتم های خوشه بندی
  • بررسی مقالات بروز در این حوزه و تشریح برخی از کاربردهای مهم
  • انجام تمرینات و پروژه های مختلف با داده های واقعی در زمینه خوشه بندی
مهندس مصطفایی
مدرس دوره

سعید مصطفایی کارشناس ارشد مهندسی فناوری اطلاعات از دانشگاه تربیت مدرس تهران هستند. ایشان ۱۰ سال سابقه کار در زمینه برنامه ریزی و کنترل پروژه های نرم افزاری دارد و اکنون در زمینه مشاوره تحلیل و طراحی نرم افزار و استقرار فرایندهای Agile در سازمان ها فعالیت می کنند. ایشان همچنین تدریس در دوره های مختلف از جمله تجزیه و تحلیل نرم افزار، مدیریت پروژه چابک، تجزیه و تحلیل کسب و کار، کاربرد فناوری اطلاعات در سازمان، مهندسی مجدد کسب و کار، برنامه نویسی موبایل با استفاده از تکنولوژی وب و PhoneGap و طراحی و برنامه نویسی تحت وب را در کارنامه خود دارد.

  • کارشناس ارشد مهندسی فناوری اطلاعات
  • دانشگاه تربیت مدرس تهران
ارائه مدرک بین المللی فنی و حرفه ای

هنرجویان عزیز، مدرک آموزشگاه تحلیل داده، مدرک رسمی از سازمان فنی و حرفه‌ای می‌باشد. دانشجویان پس از پایان دوره با ارائه پروژه کاربردی خود به آموزشگاه و پس از تایید استاد دوره گواهی پایان دوره خود را دریافت می‌نمایند.

همین حالا ثبت نام کن!
ریسپانسیو (واکنش گرا) چیست؟
ریسپانسیو (واکنش گرا) چیست؟

دیدین وقتی با موبایل وارد بعضی سایت‌ها می‌شین، متن‌ها ریزن، دکمه‌ها جابه‌جا شدن و مجبورین زوم کنین؟ ولی بعضی سایت‌ها کاملاً مرتب و خوانا هستن! راز این تفاوت چیه؟ طراحی ریسپانسیو! تو این مطلب یاد می‌گیرین چطور سایتتون رو واکنش‌گرا کنین تا روی همه دستگاه‌ها عالی دیده بشه.

جدیدترین زبان‌های برنامه‌نویسی 2025 که باید بشناسی!
جدیدترین زبان‌های برنامه‌نویسی 2025 که باید بشناسی!

دنیای برنامه‌نویسی در حال تغییره! زبان‌های جدیدی اومدن که می‌تونن کدنویسی رو سریع‌تر، امن‌تر و ساده‌تر کنن!می‌خوای بدونی آینده به کدوم سمت میره؟

🔍 معرفی بهترین لپ‌تاپ‌های برنامه‌نویسی در 1403 + بررسی و راهنمای خرید 💻
🔍 معرفی بهترین لپ‌تاپ‌های برنامه‌نویسی در 1403 + بررسی و راهنمای خرید 💻

حتماً براتون پیش اومده که موقع خرید لپ‌تاپ برای کدنویسی سردرگم بشید و ندونید کدوم مدل بهتره، نه؟ از اونجایی که لپ‌تاپ یه ابزار خیلی مهم برای برنامه‌نویس‌هاست، توی این مطلب قراره لپ‌تاپ‌های مناسب برنامه‌نویسی رو معرفی کنیم؛ از اقتصادی‌ترین مدل‌ها گرفته تا گزینه‌های حرفه‌ای و قدرتمند! هر چی لازم دارید اینجاست، پس همراه ما باشید!

برنامه نویسی چیست و از کجا شروع کنیم؟
برنامه نویسی چیست و از کجا شروع کنیم؟

سعی داریم تو این بلاگ به طور کامل شمارو با مراحل ورود به دنیای برنامه نویسی و مسیر های پیش رو آشنا کنیم تا بتونین درست تر و مطمئن تر راهتون رو انتخاب کنین.

سوالات متداول
آیا پس از پایان دوره نیز برای دانشجویان رفع اشکال انجام می گردد؟
بله شماره تلفن استاد دوره در اختیار عزیزان می باشد و دانشجویان در صورت برخورد با مشکلی می توانند از طریق تماس یا واتس اپ اقدام به رفع اشکال بنمایند.
آیا این دوره صرفا تئوری است یا عملی و پروژه محور است؟
این دوره 100 درصد عملی و کاربردی و کاملا پروژه محور است. لابد می پرسید چگونه؟ در ابتدای دوره برای هر یک از دانشجویان یک پروژه تعیین می گردد و هر دانشجو پس از تدریس هر بخش توسط استاد، مکلف به اجرای بخشی از این پروژه خود خواهد بود. هر یک از این پروژه ها توسط مدرس دوره بررسی و رفع اشکال می گردد. دریافت گواهی پایان دوره دانشجویان مشروط بر ارائه پروژه خوب و رفع ایرادات احتمالی با راهنمایی استاد، در مورد پروژه می باشد.
من شهرستان هستم، آیا می توانم در کلاس های شما شرکت کنم؟
بله، از آنجا که کلاس های ما بصورت آنلاین هم برگزار می شوند، این بستر را برای تمامی دوستان خارج از تهران فراهم کرده ایم که بتوانند در تمامی دوره های حرفه ای و تخصصی ما شرکت کنند.
پشتیبانی و پاسخگویی به دانشجویان در حین دوره چگونه است؟
به توجه به اینکه دوره به صورت حضوری/آنلاین یعنی ترکیب هر دو حالت برگزار می گردد، بنابراین دانشجویان در حین برگزاری دوره می توانند به صورت مرتب سرکلاس و یا از طریق گروه whatsapp با استاد دوره در تماس باشند، و مدرس دوره پاسخگوی شما عزیزان خواهند بود.
نظرات شما
برای ارسال سوال لازم است، ابتدا وارد سایت شوید.
آموزش برنامه نویسی محمد حسین هاشمی 1403/07/06
حضوری و انلاین؟

عرض سلام, خواستم بدونم اینکه یک جلسه رو اگر نتوانیم حضوری بیایم میتونیم همزمان به صورت انلاین شرکت کنیم ؟

آموزش برنامه نویسی ادمین 1403/07/08

سلام آقای هاشمی عزیز، لطفاً با هماهنگی تیم پشتیبانی، در کلاس‌ به صورت آنلاین شرکت کنید.

آموزش برنامه نویسی کاربر میهمان 1399/10/19
عوض شدن تاریخ یا زمان دوره داده کاوی و ماشین لرنیگ

امکانش هست روز یا تاریخ دوره عوض بشه .اخه من صبحش دوره ی پایتون با استاد مصطفایی دارم. بعد بلافاصله شروع دوره سخته.

آموزش برنامه نویسی ادمین 1399/10/19

درود کاربر عزيز با اتمام يا اواخر دوره پايتون ميتوانيد در دوره داده کاوي شرکت کنيد.

این دوره به سبد خرید اضافه شد
دوره آموزش یادگیری ماشین 6,500,000
رفتن به سبد خرید