مشخصات مقاله
-
0.0
-
2478
-
0
-
0
مد،میانگین،میانه در یادگیری ماشین
در یادگیری ماشین و در ریاضیات اغلب سه فاکتور مهم وجود دارد که برای تجزیه و تحلیل جامعه آماری به آنها نیاز خواهیم داشت:
- • Mean - میانگین/li>
- • Median - میانه
- • Mode - مد
میانگین (Mean)
برای مثال سرعت 13 خودرو را ثبت کرده ایم:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
میانگین، متوسط و مد مقدار سرعت خودرو ها را می خواهیم بدست بیاوریم. برای محاسبه میانگین، مجموع همه مقادیر را بیابید و بر تعداد مقادیر تقسیم کنید:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
ماژول NumPy روشی برای سریع تر انجام دادن این پروسه ارائه نموده است. ماژول نامپای یک لایبری قابل افزودن به زبان برنامهنویسی پایتون است که کاربرد اصلیاش برای مقاصد علمی و کار با اعداد است. این ماژول شامل توابع آرایهای ریاضیات و آمار در زبان برنامهنویسی پایتون است. ماژول نامپای در خیلی از کتابخانههای کُد و پروژهها مورد استفاده قرار می گیرد.
در ادامه برای یافتن میانگین سرعت از متد ()NumPy mean استفاده می نماییم:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
خروجی :
89.76923076923077
میانه (Median)
پس از اینکه همه مقادیر را مرتب کردید، مقدار میانه داده وسط است:
77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111
قبل از اینکه بتوانید میانه را پیدا کنید، مهم است که اعداد مرتب شوند. در ادامه با استفاده از ماژول numpy به یافتن میانه داده های ورودی می پردازیم.
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
خروجی
87.0
77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
با کمک ماژول NumPy:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
خروجی
86.5
مد (Mode)
مد Mode مقداری است که در بین داده های جمع آوری شده، بیشتر از همه ظاهر می شود:
99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86
ماژول SciPy روشی برای یافتن مد ارائه نموده است. SciPy (سای پای) یک کتابخانه علمی و اوپن سورس مبتنی بر زبان پایتون جهت انجام محاسبات علمی و مهندسی مورد نیازاست. کتابخانهی SciPy بر مبنای کتابخانهی NumPy است و امکان کار با آرایههای n بُعدی را ایجاد می نماید.
from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
خروجی :
ModeResult(mode=array([86]), count=array([3]))