Python 机器学习 正态数据分布(Normal Data Distribution)

机器学习使计算机从研究数据和统计数据中学习机器学习是向人工智能(AI)方向迈进的一步。机器学习是一个分析数据并学习预测结果的程序。本文主要介绍Python 机器学习 正态数据分布(Normal Data Distribution)。

1、正态数据分布

在上一章中,我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。

在本章中,我们将学习如何创建一个将值集中在给定值周围的数组。

在概率论中,在数学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)提出了这种数据分布的公式之后,这种数据分布被称为正态数据分布或高斯数据分布。

例如:

典型的正态数据分布:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 100000)

plt.hist(x, 100)
plt.show()

 Result:


注意:由于正态分布图具有钟形的特征形状,因此也称为钟形曲线。

直方图解释

我们使用numpy.random.normal()方法中的数组,该数组具有100000个值,以绘制100个条形的直方图。

我们指定平均值为5.0,标准差为1.0。

这意味着该值应集中在5.0左右,并且很少远离平均值小于1.0。

从直方图中可以看到,大多数值都在4.0到6.0之间,最高值大约是5.0。

推荐阅读
cjavapy编程之路首页