如何通俗的解释泰勒公式?
▍如何通俗的解释泰勒公式?
泰勒公式是一个函数在一点处的多项式形式的展开式,其系数可以通过求导得到,比较适用于非周期的函数。其好处是展开式是多项式,形式比较简单。
周期函数则更适合于傅立叶级数展开。
▍如何通俗的解释泰勒公式?
(关于泰勒公式小石头这里有两钟不同的解释与大家分享!)
我们知道 √2 作为第一个被发现的无理数, 是不能用 有理分数精确表示的,但是我们可以用 有理分数 来无限逼近:
这就是,所谓的无限(不循环)小数:
这种无限逼近的思想就是后来鼎鼎大名的极限,其在数学中由来已久,比如:用割圆术求π值,而且生活中也经常被大家使用,例如:
将金属物体表明抛光:先用粗颗粒的砂纸打磨,然后用中颗粒砂纸,然是细颗粒,然后是颗粒更细的研磨膏,然后是更更细的,... 这个过程一直进行下去,我们就可以得到越来越光亮的金属表面;称取一斤盐:根据经验先往秤盘里加一斤盐左右的盐,发现多了取出来一些、发现少了再加一些,...这个过程一直进行下去,我们就可以得到越来越接近一斤的盐;对于给定的函数 f(x) ,我们也可以用一个函数的序列 f₀(x), f₁(x), f₂(x), ... 来无限的逼近它,即,
f(x) = f₀(x) + f₁(x) + f₂(x) + ⋯
接下来,我们需要确定 这个序列!
首先,观察 √2 无限逼近形式 (1),我们可这样理解:
从 原点 0 出发 ,沿着坐标轴方向,
先用 步距是 1/10⁰ = 1 的步伐 走 1 步;
再用 步距是 1/10¹ = 0.1 的步伐 走 4 步;
再用 步距是 1/10² = 0.01 的步伐 走 1 步;
....
再用 步距是 1/10ⁿ 的步伐 走 a_n 步;
....
可见,这里的关键是 越来越小的 步距序列:
1/10⁰ > 1/10¹ > 1/10² > ⋯ > 1/10ⁿ > ⋯
所以,我们要可以逼近 f(x) 就是首先要找到 一个 越来越小的 函数序列。
我们先降低要求,不对 整个 f(x) 逼近,只逼近 x = 0 附近的 f(x) 部分,这时我们发现,幂函数 序列:
x⁰ , x¹, x² , x³, ..., xⁿ, ...
在 x = 0 附近 (-1, 1) 是满足 (绝对值)越来越小的 要求的。
于是,仿照 √2 ,令,
则有,
这称为幂级数,最后,要做的事情就是确定幂级数的系数了。
首先,将 x = 0 带入 式(2),立即得到,a₀ = f(0) = f(0)/0!;
然后,我们对 式(2) 两边求导,有:
再将 x = 0 带入 式(2.1),得到,a₁ = f'(0) = f'(0)/1!;
然后,我们对 式(2.1) 两边求导,有:
再将 x = 0 带入 式(2.2),得到,a₁ = f''(0)/2 = f''(0)/2!;
然后,我们对 式(2.2) 两边求导,有:
再将 x = 0 带入 式(2.3),得到,a₂ = f'''(0)/3⋅2 = f'''(0)/3!;
...
然后,我们对 式(2.n-1) 两边求导,有:
再将 x = 0 带入 式(2.3),得到,a_n = f⁽ⁿ⁾(0)/n⋅(n-1)⋅(n-2)⋯2 = f⁽ⁿ⁾(0)/n!;
...
这样,我们就通过递归的方式,逐一确定了系数,并且最终得到了:
这称为 迈克劳林公式。
利用 迈克劳林公式,指数函数 f(x) = eˣ 的 幂级数展开式为:
其,逼近情况如下图:
我们可以看到,随着幂级数项数的增加,在 x = 0 附近的,蓝色的 幂级数 越来越逼近 绿色 的指数函数。同时,我们还发现,在 距离 x = 0 很远的地方,幂级数项数少的时候,逼近情况并不好,这是 迈克劳林公式的一个局限!
迈克劳林公式的另外一个问题是,有些函数的 导数 在 x = 0 处 没有意义,例如:函数 √x 的 导数是 1/2 √x。
为了弥补这两个缺陷,我们考虑 将 逼近中心,从 x = 0 移动到 任意 x = a,这时,我们每个函数项为:
然后,用与上面的一样的方法(只不过,每次带入 x = a),可以求得系数为:
最后,得到:
这就是 泰勒公式。
利用 泰勒公式 就可以 得到 √x 在 x = 1 处展开式了:
代入 x=2 就可以得到 √2 的另外一种逼近:
综上,我们可以得出 小结论1:
泰勒公式就是 在 x = a 点附近 利用幂函数序列 (x - a)⁰, (x - a)¹, (x - a)², (x - a)³, ... 来逼近 函数 f(x)。
由《平面解析几何》知,平面上的点和二维向量一一对应,所有这些二维向量组成一个二维向量空间,记为 R² ,在这些二惟向量中, 单位向量 ε₁ = (1, 0),ε₂ = (0, 1) 分别指向 X 轴 和 Y 轴 的正方向。
对于 R² 中任意一个 向量 α = (a₁, a₂),都有:
即,
这说明 任意一个 向量 α 都可以用 ε₁, ε₂ 来表示,我们称 ε₁, ε₂ 为向量空间 R² 的一组基,称这种表式为 线性表示。
基 ε₁, ε₂ 和 坐标轴 X, Y 对应,线性表示的系数 a₁, a₂ 就是 α 的坐标分量, (a₁, a₂) 就是 α 在 ε₁, ε₂ 对应 坐标系 XY 中的 坐标。
类似地,以上模式,对于任意 n 维空间 Rⁿ 同样适用。我们 只需 令 Rⁿ 的 基 为:
ε₁ = (1, 0, ..., 0),ε₂ = (0, 1, 0, ..., 0), ..., ε_n = (0, 0, ..., 1)
则, Rⁿ 中 任意 n维向量 α ,都可以被线性表示为:
其中,系数 (a₁, a₂, ..., a_n) 为 α 在 ε₁, ε₂, ..., ε_n 对应坐标系中的 坐标。
不仅如此,我们还可以将有限维向量 α = (a₁, a₂, ..., a_n) 升级为无限维 α = (a₁, a₂, ...) ,无限维向量也就是序列,记为 α = {a₁, a₂, ...},将全体序列记为 l。定义 无限个元素的基为:
ε₁ = {1, 0, ...}, ε₂ = {0, 1, 0, ...}, ...
则, l 中 任意序列 α = {a₁, a₂, ...} ,都可以被线性表示为:
其中,系数 (a₁, a₂, ...) 为 α 在 ε₁, ε₂, ... 对应无限坐标系中的 坐标。
序列,α = {a₁, a₂, ...},其实就是 正整数 Z₊ 到 实数 R 的映射,α: Z₊ → R,其中 Z₊ 中的 正整数 作为 序列下标,任意给定 一个 下标 i ∈ Z₊ 都可以通过 α 得到,序列的第 i 个 数字
考虑将 映射 α 的定义域,由 正整数 Z₊ 变为 实数 R,这样 映射 α 就变成了 我们熟悉的 函数 f: R → R,我们将 区间 [a - b, a + b] ⊂ R 内 满足 一定条件 的全体 函数 组成 函数空间, 记为 L²[a - b, a + b]。定义 无限个元素的基为:
ε₀ = (x-a)⁰, ε₁ = (x-a)¹, ε₂ = (x-a)², e₃ = (x-a)³, ...
则,函数空间 L²[a - b, a + b] 中 任意 函数 f(x) 都可以 用 这一组基 来线性表示:
这就是 泰勒公式。
这个一定条件指的是:f(x) 在 区间 [a - b, a + b] 内 2 次可 积分,即,
存在。(更准确的定义 必须使用测度论,这里就不引入了!)
当 a = 0, b = 1 时,空间 L²[-1, 1] 内 任意 函数 f(x) 都可以被 幂函数 基 x⁰, x¹, x², x³, ... 线性表示为:
这就是 泰勒公式的特殊形式 迈克劳林公式。
注意:前面的 指数函数 f(x) = eˣ 满足 条件2,所以属于 L²[-1, 1] 于是可以被 迈克劳林公式 表示;而 函数 f(x) = √x,在 [-1, 0) 没有定义 所以 不属于 L²[-1, 1] ,但是 它属于 L²[0, 2],所以才有前面的 泰勒公式 展开。
综上,我们可以得出 小结论2:
泰勒公式,
中的 幂函数 (x-a)⁰, (x-a)¹, (x-a)², (x-a)³,... 其实 是 无限维 函数空间 L²[a - b, a + b] 的一组基,构成 L²[a - b, a + b] 的一个无限坐标系,系数 (a₁, a₂, ... ) ,f(x) 在 这个坐标系中的 坐标。
(所谓通俗解释,就是非常个人化的理解,并不是非常严谨,以上仅仅是小石头的理解方式,写在这里起到抛砖引玉的作用,相信头条的各位老师会有更精彩的回答!)
▍如何通俗的解释泰勒公式?
如何通俗理解泰勒公式呢?
首先我给你一个很长的泰勒公式:
你说道,我看不懂。这个公式有什么用呢?
于是我们随便把一个函数,比如e^x用泰勒公式改写,原来e^x居然能展开成幂函数相加的形式!
你说道,我还是不明白,还是不够直观。
于是,我们画出了y=e^x的图像:
y=e^x的图像
当x拟合到5次方时,已经和e^x基本重合了,如果一直加下去,结果可想而知:
再举个例子:
现在我们来做实验:
继续增大拟合项:
你看,它又跟进了更多的sinx
现在,你再来看它
是不是算初识了呢?
为什么需要凑够300字才能声明原创,那我就再举个例子吧:
比如我们的著名函数:
你突然想问,ln2等于多少?如果你手头没有计算器,怎么办呢?当然是把x=2带进上面的等式里了,不过,你要知道:就连你的计算器其实也是按照这个泰勒展开公式来算ln2的,没想到吧?
▍如何通俗的解释泰勒公式?
公式我就不粘了。直接给你说作用。如果你的数学卷子上给你出一道sin(0.05)等于多少,cos(0.1)等于多少,ln(1.02)这种题,还不让你用计算器,只能手算,那么你能算出来吗?这个时候泰勒公式就发挥它的作用了。
泰勒公式的作用,一句话说就是,把不使用加减乘除的初等函数(诸如三角函数、反三角函数、对数函数,等等)化为使用加减乘除计算的函数,这种函数的形式是高次无穷多项式。
等价无穷小其实就是泰勒公式的前一项或者两项、三项。
比如,x趋于0时,sinx等价于x,因此sin(0.05)约等于0.05。
x趋于0时,cos(x)等价于1-x²/2,因此,cos(0.1)约等于1-0.1²/2=0.995
x趋于0,ln(x+1)等价于x,因此,ln(1.02)=ln(1+0.02)约等于0.02。
▍如何通俗的解释泰勒公式?
8
------
这里主要是对高票答案的总结, 外加一些自己的理解, 希望能写的更通俗易懂一些, 方便大家理解.
麦克劳林公式对于一些复杂的函数, 要研究其性质往往是比较困难的. 而多项式函数的性质往往比较简单, 所以有时候, 为了方便研究, 我们可能会想着: 能不能用一个多项式函数去近似一个复杂的函数?
比如说, 现在我们想在点0附近, 用一个多项式函数, 去近似一个复杂函数
我们知道当x=0时,
, 所以不妨拿一个"当x=0时, y值也为1的函数"来近似试试, 比如说: y = 1
绿色的线是e^x, 蓝色的线是y = 1, 下同
可以看到, 在x=0这一点上, 两个函数的值都是1, 但在x=0的邻域, 这两个函数的图像一点都不相似, 所以这个近似效果一般...
那如何让近似效果更好一些呢, 可以想到, 不妨用导数试试. 导数可以反应函数在某一点的变化率, 如果两个函数在x=0处, 除了y值相同, 变化率也相同, 那两个函数应该会更相似一些.
, 当x=0时,
的导数为1
所以我们需要近似函数在x=0处的导数也为1, 比如说这个函数: y = 1 + x, 其导数y'等于常数1, 在x=0处的导数自然也为1
现在: 原始函数
, 近似函数y = 1 + x, 这两个函数在x=0处, 除了y值相同, 导数也相同. 我们来看看这两个函数的图像
两个函数的图像更接近了, 看来这个思路是正确的, 那沿着这个思路, 如果让近似函数在x=0处的二阶导, 和
在x=0处的二阶导也相同呢...即在x=0处, 两个函数变化率的变化率也相同...
所以
在x=0处的二阶导也为1
那么我们选定近似函数:
近似函数在x=0时, y=1,
近似函数的一阶导为1+x, 当x=0时, 一阶导为1,
近似函数的二阶导为常数1, 当x=0时, 二阶导也为1,
这些值和
在x=0处的y值, 一阶导, 二阶导的值是相同的, 来看看两个函数的图像
更相近了...
然后我们按照这个思路, 来试试三阶导
让近似函数在x=0处的y值, 一阶导, 二阶导, 三阶导的值 =
在x=0处的y值, 一阶导, 二阶导, 三阶导的值
比如近似函数为:
(这个函数是满足上述条件的, 这里就不验证了)
看一下图像:
更相近了..
再来看几张:
四阶导相同
五阶导相同
十阶导相同, 近似函数和原始函数n阶导相同, n越大, 近似程度越高
按这个思想, 假设原始函数在x = 0处n阶可导(比如
在x=0处就是n阶可导)
如果让近似函数在x=0处的y值, 一阶导, 二阶导 ...n阶导的值 =
在x=0处的y值, 一阶导, 二阶导 ...n阶导的值. 则可以推测此时两个函数的图像应该会很相似, 或者说近似函数对原始函数的近似效果应该会很好, 事实也确实如此.
麦克劳林公式(麦克劳林公式就是x0=0时的泰勒公式, 后面会具体讲泰勒公式)就是在描述: 如何找到满足上述条件的近似多项式函数, 写成公式大概是:
左侧是原始函数, 右侧是近似多项式函数
而两者之间的关系只是约等于, 或者说是近似. 实际上, 完整的麦克劳林公式是这样的:
后面的
是佩亚诺余项, 加上这个佩亚诺余项, 左右就相等了
麦克劳林公式的含义就是: 如何在x=0附近, 用一个多项式函数(等号右侧的函数), 去近似一个复杂函数(等号左侧的函数)
(这里稍微说一下佩亚诺余项: 在麦克劳林公式中, 佩亚诺余项
是个当x→0时比
高阶的无穷小, 这也就说明, 在x=0附近, 用麦克劳林公式产生的多项式函数(不含余项部分)去近似原始函数时, x离0越近的地方, 近似的误差越小, 近似效果越好, x离0越远的地方, 近似的误差越大, 近似效果越坏)
2. 为什么麦克劳林公式会是这种形式
麦克劳林公式:
为什么等号右侧的多项式(不含最后的余项)要写成这种形式呢? 其实理论上, 右侧的多项式也可以写成别的形式, 其本质只是为了满足下面这个条件:
让右侧多项式函数在x=0处的y值, 一阶导, 二阶导 ...n阶导的值 = 被近似函数在x=0处的y值, 一阶导, 二阶导 ...n阶导
这里的多项式
只是满足这个条件的一种形式. 如果还有别的形式的函数可以满足这个条件, 它也可以替换掉麦克劳林公式中的的多项式部分.
这里引用下"各向异性角点解"同学的一段话:
泰勒展开(或者说麦克劳林公式)并不是唯一的,因为任何在对应阶求导后能够消失并只留下导数值的函数,都可以作为泰勒展开的备胎。可惜的是,幂函数与阶乘的组合,是我们已知的唯一具有上述性质的函数,因此,这种唯一性决定了泰勒展开能够且仅能够由幂函数表示。
3. 泰勒公式
麦克劳林公式只是泰勒公式在x0=0时的特殊情况, 现在抛开x0=0, 让x0可以是函数定义域中的任意值(只要在x0处n阶可导就行), 就变成了泰勒公式
理解了麦克劳林公式, 很快就能理解泰勒公式了: 泰勒公式用于在x0附近, 用一个多项式函数(等号右侧的函数), 去近似一个复杂函数(等号左侧的函数)
4. 总结
I. 泰勒公式的作用是描述如何在x0点附近, 用一个多项式函数去近似一个复杂函数.
II. 之所以能实现这种近似, 背后的逻辑是:
让近似多项式函数在x=x0处的y值, 一阶导, 二阶导 ...n阶导的值 = 原始函数在x=x0处的y值, 一阶导, 二阶导 ...n阶导
即, 如果函数A和函数B在某一点的值一样, 变化率一样, 变化率的变化率一样, 变化率的变化率的变化率也一样...
就这样层层深入, 无论深入到哪一个维度, 关于这一点的变化率, 函数A和函数B都是一样的, 那就可以推断:
在这一点上, 函数A和B应该是一样的
在这一点附近, 函数A和B应该很相似
离这一点越远, 函数A和B的相似程度就越难以保证
...
最后需要说明的是, 这篇答案更多的是: 在默认泰勒公式正确性的前提下, 告诉大家如何去"直观感受"这种正确性, 去理解这么长的一串公式背后所表达的简单含义, 并粗略地理解公式成立的大体原因. 至于泰勒公式究竟是如何推导出来的, 其背后经过了怎样地严格证明, 这里并没有真正提及, 这些内容需要大家去查阅更多的资料, 进行深入的理解...
------------------
推荐阅读: