Python 机器学习 标准差(Standard Deviation)

机器学习使计算机从研究数据和统计数据中学习机器学习是向人工智能(AI)方向迈进的一步。机器学习是一个分析数据并学习预测结果的程序。本文主要介绍Python 机器学习 标准差。

1、什么是标准偏差?

标准偏差是一个数字,描述值的分散程度。

低标准偏差意味着大多数数字接近均值(平均值)。

高标准偏差表示这些值分布在更宽的范围内。

示例:这次我们已经注册了7辆车的速度:

speed = [86,87,88,86,87,85,86]

标准偏差为:

0.9

意味着大多数值在平均值的0.9范围内,即86.4。

让我们对范围更广的数字进行选择:

speed = [32,111,138,28,59,77,97]

标准偏差为:

37.85

这意味着大多数值在平均值的37.85范围内,即77.4。

如您所见,较高的标准偏差表示这些值分布在较宽的范围内。

NumPy模块有一种计算标准偏差的方法:

例如:

使用NumPystd()方法查找标准偏差:

import numpy

speed = [86,87,88,86,87,85,86]

x = numpy.std(speed)

print(x)

例如:

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)

2、方差(Variance)

方差是另一个数字,指示值的分散程度。

实际上,如果采用方差的平方根,则会得到标准偏差!

或反之,如果将标准偏差乘以自身,就可以得到方差!

要计算方差,必须执行以下操作:

1)找到均值:

(32+111+138+28+59+77+97) / 7 = 77.4

2)对于每个值:找到与平均值的差:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3)对于每个差异:找到平方值:

(-45.4)2 = 2061.16
 (33.6)2 = 1128.96
 (60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 =  338.56
(- 0.4)2 =    0.16
 (19.6)2 =  384.16

4)方差是这些平方差的平均值:

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

幸运的是,NumPy有一种计算方差的方法:

例如:

使用NumPyvar()方法来查找差异:

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.var(speed)

print(x)

3、标准偏差(Standard Deviation)

例如:

使用NumPystd()方法查找标准偏差:

import numpy

speed = [32,111,138,28,59,77,97]

x = numpy.std(speed)

print(x)

4、符号

标准偏差通常用符号Sigma:σ

方差通常用符号Sigma Square: σ2

5、小结

标准偏差和方差是机器学习中经常使用的术语,因此了解如何获取它们以及它们背后的概念非常重要。

推荐阅读
cjavapy编程之路首页