Python 为什么不解决四舍五入的“bug”
因为二进制浮点数不能解决这个问题。
创新互联公司一直通过网站建设和网站营销帮助企业获得更多客户资源。 以"深度挖掘,量身打造,注重实效"的一站式服务,以网站制作、成都网站建设、移动互联产品、成都全网营销推广服务为核心业务。十年网站制作的经验,使用新网站建设技术,全新开发出的标准网站,不但价格便宜而且实用、灵活,特别适合中小公司网站制作。网站管理系统简单易用,维护方便,您可以完全操作网站资料,是中小公司快速网站建设的选择。
先看一个现象,和 round 无关的:
def show(x):
... """打印一个数,20 位精度"""
... print('{:.20f}'.format(x))
...
show(1.5)
1.50000000000000000000
show(1.25)
1.25000000000000000000
show(1.245)
1.24500000000000010658
show(1.45)
1.44999999999999995559
show(1.415)
1.41500000000000003553
从数学上看,一个既约分数(有理数)n/d 要表示为 B 进制数,如果 d
的所有素因子都整除 B,就说明存在一个整数 k,使得分母 d 整除 B^k——比如 q * d = B^k,于是此时有 n/d = n /
(B^k / q) = nq / B^k,也就是说 n/d 可以使用至多 k 位数的 B 进制小数有限表示。
反之,也容易证明,如果 d 有素因子不能整数 B,那么就不存在上面的 k,也就是说有理数 n/d 不可能由有限位数的 B 进制数表示。——也就是说会出现循环小数。
对于 10 进制数,所有分母只有素因子 2 和 5 的有理数,都能表示为有限小数。比如 1/2 是 0.5,1/4 是 0.25,1/5 是 0.2,3/8 是 0.375,都是有限的。
而对于 2 进制数,分母里面只有素因子 2 的有理数,才能表示为有限小数。所以 1/2 是 0.1,1/4 是 0.01,3/8 是 0.011。但 1/5 就不能用有限二进制数表示了,是个循环小数 0.0011 0011 0011……。
(什么,你问无理数?小学生都知道无理数是无限不循环小数。)
现在:
计算机的浮点数是用小数表示的。浮点数就是科学计数法,指数部分是个整数,尾数部分是个小数。
计算机的存储是有限的,所以只能使用有限位数的小数表示。
计算机硬件通常是用二进制运算的。
具体到 Python 的 float,C/C++ 的 float/double,都是有限长度的、二进制、浮点数。准确地说,是这个:IEEE floating point
现在问题来了。人写程序用十进制数,计算机运行程序用二进制数,怎么办?转换呗。
从概念上说,就是我写:
a(10) = 0.5
计算机读:
a(2) = 0.1
我写:
b(10) = 0.375
计算机读
b(2) = 0.011
可如果我写
c(10) = 0.2
计算机就只能读成了有限位数,比如 12 位:
c(2) = 0.0011 0011 0011(咔嚓切断)
其实这个被截断保留 12 位二制制位的数用十进制表示是 0.199951171875,已经不准了。你说不对呀这个小了,最后一位能不能加上去,让计算机读成
c(2) = 0.0011 0011 0100(进了一位)
这个数用十进制表示则是 0.2001953125,又大了。
——实际的计算机中,python 的 float 是用 64 位浮点数,其中 53 位是尾数部分,误差小得多了,但还是不可能没有。
所以,计算机在把人写的程序转换为内部代码的时候,就必须做十进制到二进制的转换。这个转换就已经不得不带来误差了。当然,像前面说的,不是所有的数都有误差,0.5、3.75、78.625 都不会有误差,但简单的 0.2、3.15 就会有进制转换误差。
所以,在开始计算 round 这个四舍五入的函数之前,在程序刚被读入计算机时,这个变量的值早已经不精确了。round 又能解决什么问题?
话
说回来,round 本身在一些情况下是准确的。比如 0.5、1.5、2.5、3.5 这些数,都能用有限位二进制数表示,它们直接 round
的结果也都是准确的,不过使用的不是四舍五入而是无偏算法(把 0.5 向偶数而不是向上舍入,这里指 Python 3)。round
在另一些情况下又可能是不准确的,因为 Python 的 round
有两个参数,第二个参数表示舍入到第几位,就需要对原数先计算再舍入,就不准确了。
如果让 Python
减慢速度,也在内部用十进制表示和计算,就不会出现进制转换和移位这种来源的舍入误差,此时做舍入运算或输入输出就是精确的了。虽然这不能防止其他计算
(比如除法、三角函数)带来的误差,但在一些场合,比如金融算钱的时候,还是非常有用的。在 Python 里面可以用 decimal
包来使用十进制浮点数,避免输入输出的带来的进制转换误差,按十进制移位时除法带来的误差等。
小结:
误差主要来自输入时十进制转换为计算机内部二进制时,且这个问题在有限精度下不可能解决,也不需要解决。
round 可以准确舍入,但它涉及的移位计算也可能带来其他误差。
Python 的 decimal 包可用于解决这一问题。
如何用Python进行线性回归以及误差分析
线性回归:
设x,y分别为一组数据,代码如下
import matplotlib.pyplot as plt
import numpy as np
ro=np.polyfit(x,y,deg=1) #deg为拟合的多项式的次数(线性回归就选1)
ry=np.polyval(ro,x) #忘记x和ro哪个在前哪个在后了。。。
print ro #输出的第一个数是斜率k,第二个数是纵截距b
plt.scatter(x,y)
plt.plot(x,ry)
Python科学计算——任意波形拟合
任意波形的生成 (geneartion of arbitrary waveform) 在商业,军事等领域都有着重要的应用,诸如空间光通信 (free-space optics communication), 高速信号处理 (high-speed signal processing),雷达 (radar) 等。在任意波形生成后, 如何评估生成的任意波形 成为另外一个重要的话题。
假设有一组实验数据,已知他们之间的函数关系:y=f(x),通过这些信息,需要确定函数中的一些参数项。例如,f 是一个线型函数 f(x)=k*x+b,那么参数 k 和 b 就是需要确定的值。如果这些参数用 p 表示的话,那么就需要找到一组 p 值使得如下公式中的 S 函数最小:
这种算法被称之为 最小二乘拟合 (least-square fitting)。scipy 中的子函数库 optimize 已经提供实现最小二乘拟合算法的函数 leastsq 。下面是 leastsq 函数导入的方式:
scipy.optimize.leastsq 使用方法
在 Python科学计算——Numpy.genfromtxt 一文中,使用 numpy.genfromtxt 对数字示波器采集的三角波数据导入进行了介绍,今天,就以 4GHz三角波 波形的拟合为案例介绍任意波形的拟合方法。
在 Python科学计算——如何构建模型? 一文中,讨论了如何构建三角波模型。在标准三角波波形的基础上添加了 横向,纵向的平移和伸缩特征参数 ,最后添加了 噪声参数 模拟了三角波幅度参差不齐的随机性特征。但在波形拟合时,并不是所有的特征参数都要纳入考量,例如,噪声参数应是 波形生成系统 的固有特征,正因为它的存在使得产生的波形存在瑕疵,因此,在进行波形拟合并评估时,不应将噪声参数纳入考量,最终模型如下:
在调用 scipy.optimize.leastsq 函数时,需要构建误差函数:
有时候,为了使图片有更好的效果,需要对数据进行一些处理:
leastsq 调用方式如下:
合理的设置 p0 可以减少程序运行时间,因此,可以在运行一次程序后,用拟合后的相应数据对 p0 进行修正。
在对波形进行拟合后,调用 pylab 对拟合前后的数据进行可视化:
均方根误差 (root mean square error) 是一个很好的评判标准,它是观测值与真值偏差的平方和观测次数n比值的平方根,在实际测量中,观测次数n总是有限的,真值只能用最可信赖(最佳)值来代替.方根误差对一组测量中的特大或特小误差反映非常敏感,所以,均方根误差能够很好地反映出测量的精密度。
RMSE 用程序实现如下:
拟合效果,模型参数输出:
leastsq 函数适用于任何波形的拟合,下面就来介绍一些常用的其他波形:
新闻标题:python函数误差 python计算均方误差
链接地址:http://scgulin.cn/article/doohjhj.html