1、什么是标准偏差?
标准偏差是一个数字,描述值的分散程度。
低标准偏差意味着大多数数字接近均值(平均值)。
高标准偏差表示这些值分布在更宽的范围内。
示例:这次我们已经注册了7辆车的速度:
speed = [86,87,88,86,87,85,86]
标准偏差为:
0.9
意味着大多数值在平均值的0.9范围内,即86.4。
让我们对范围更广的数字进行选择:
speed = [32,111,138,28,59,77,97]
标准偏差为:
37.85
这意味着大多数值在平均值的37.85范围内,即77.4。
如您所见,较高的标准偏差表示这些值分布在较宽的范围内。
NumPy模块有一种计算标准偏差的方法:
例如:
使用NumPystd()
方法查找标准偏差:
import numpy speed = [86,87,88,86,87,85,86] x = numpy.std(speed) print(x)
例如:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
2、方差(Variance)
方差是另一个数字,指示值的分散程度。
实际上,如果采用方差的平方根,则会得到标准偏差!
或反之,如果将标准偏差乘以自身,就可以得到方差!
要计算方差,必须执行以下操作:
1)找到均值:
(32+111+138+28+59+77+97) / 7 = 77.4
2)对于每个值:找到与平均值的差:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138 - 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77 - 77.4 = - 0.4
97 - 77.4 = 19.6
3)对于每个差异:找到平方值:
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4)方差是这些平方差的平均值:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2
幸运的是,NumPy有一种计算方差的方法:
例如:
使用NumPyvar()
方法来查找差异:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.var(speed) print(x)
3、标准偏差(Standard Deviation)
例如:
使用NumPystd()
方法查找标准偏差:
import numpy speed = [32,111,138,28,59,77,97] x = numpy.std(speed) print(x)
import numpy as np arr = np.array([1,2,3,4]) print("variance of [1,2,3,4]:", np.var(arr)) print("sqrt of variance [1,2,3,4]:",np.sqrt(np.var(arr))) print("standard deviation: np.std()", np.std(arr))
4、符号
标准偏差通常用符号Sigma:σ
方差通常用符号Sigma Square: σ2
5、小结
标准偏差和方差是机器学习中经常使用的术语,因此了解如何获取它们以及它们背后的概念非常重要。