1、平均值,中值和众数
从一组数字中我们可以学到什么?
在机器学习(和数学)中,通常存在三个我们感兴趣的值:
- 平均值-平均值
- 中位数-中点值
- 众数-最常见的值
示例:我们已经注册了13辆车的速度:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
平均值,中间值或最常见的速度值是多少?
2、Mean(平均值)
Mean是平均值。
要计算平均值,请找到所有值的总和,然后将总和除以值的数量:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
NumPy模块为此提供了一种方法。在我们的NumPy教程中了解有关NumPy模块的信息。
例如:
使用NumPymean()
方法查找平均速度:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
3、Median(中值)
中值是对所有值进行排序后的中间值:
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
在找到中位数之前,对数字进行排序很重要。
NumPy模块为此提供了一种方法:
例如:
使用NumPymedian()
方法查找中间值:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
如果中间有两个数字,则将这些数字之和除以2。
77, 78, 85, 86, 86,
86, 87
, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
例如:
使用NumPy模块:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
4、Mode(众数)
众数值是出现次数最多的值:
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
SciPy模块为此提供了一种方法。在我们的SciPy教程中了解有关SciPy模块的信息。
例如:
使用SciPymode()
方法查找出现次数最多的数字:
from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
5、小结
平均值,中位数和众数是机器学习中经常使用的技术,因此了解它们背后的概念很重要。