为什么 scipy.optimize.curve_fit 不能为我的点生成最适合的线？

如何解决为什么 scipy.optimize.curve_fit 不能为我的点生成最适合的线？

我正在尝试为重复 R-T 测量绘制多个数据集，并使用 scipy.optimize.curve_fit 拟合每个数据集的最佳拟合三次根线。

我的代码为每个数据集生成一条线，但不是最佳拟合的三次方根线。每个数据集都根据其对应的最佳拟合线进行颜色编码：

我尝试增加数据的数量级，因为我听说有时 scipy.optimize.curve_fit 不喜欢非常小的数字，但这并没有改变。如果有人能指出我哪里出错了，我将不胜感激：

import numpy as np
from scipy.optimize import curve_fit 
import scipy.optimize as scpo
import matplotlib.pyplot as plt    

files = [ '50mA30%set1.lvm','50mA30%set3.lvm','50mA30%set4.lvm','50mA30%set5.lvm']

for file in files:
                                    
    data = numpy.loadtxt(file)                     
      
    current_YBCO = data[:,1] 
    voltage_YBCO = data[:,2] 
    current_thermometer = data[:,3]
    voltage_thermometer = data[:,4]
    T = data[:,5]

    R = voltage_thermometer/current_thermometer
    p = np.polyfit(R,T,4)
    T_fit = p[0]*R**4 + p[1]*R**3 + p[2]*R**2 + p[3]*R + p[4] 
    y = voltage_YBCO/current_YBCO
    
    def test(T_fit,a,b,c): 
        return a * (T_fit+b)**(1/3) + c

    param,param_cov = curve_fit(test,np.array(T_fit),np.array(y),maxfev=100000) 

    ans = (param[0]*(np.array(T_fit)+param[1])**(1/3)+param[2])

    plt.scatter(T_fit,y,0.5)
    plt.plot(T_fit,ans,'--',label ="optimized data") 
    plt.xlabel("YBCO temperature(K)")
    plt.ylabel("Resistance of YBCO(Ohms)")
    plt.xlim(97,102)
    plt.ylim(-.00025,0.00015)

解决方法

有两件事让你更难做到这一点。

首先，numpy 数组的负数立方根。如果你尝试这个，你会发现你没有得到你想要的结果：

x = np.array([-8,8])
x**(1/3)  # array([nan,0.,2.])

这意味着您的 test 函数在任何时候得到负值时都会出现问题，您需要负值来创建曲线的左侧。相反，使用 np.cbrt

x = np.array([-8,8])
np.cbrt(x) # array([-2.,2.])

其次，你的功能是

def test(T_fit,a,b,c):
    return a * (T_fit + b)**(1/3) + c

不幸的是，这看起来与您展示的图表不太一样。这使得优化很难找到“好的”拟合。我特别不喜欢这个功能的地方是

它在 T_fit == b 处垂直。您的数据此时具有确定的斜率
它在远离 T_fit = b 的地方继续保持强劲增长。您的数据是横向的。

但是，通过为优化提供一个好的起点，有时可能会获得更“合理的拟合”。

你没有给我们任何代码来工作，这使得这变得更加困难。所以，通过说明，试试这个：

import matplotlib.pyplot as plt
import numpy as np
import scipy.optimize

fig,ax = plt.subplots(1)

# Generate some data which looks a bit like yours
x = np.linspace(95,105,1001)
y = 0.001 * (-0.5 + 1/(1 + np.exp((100-x)/0.5)) + 0.125 * np.random.rand(len(x)))

# A fitting function
def fit(x,c):
    return a * np.cbrt((x + b)) + c

# Perform the fitting
param,param_cov = scipy.optimize.curve_fit(fit,x,y,p0=[0.004,-100,0.001],maxfev=100000)

# Calculate the fitted data:
yf = fit(x,*param)
print(param)

# Plot data and the fitted curve
ax.plot(x,'.')
ax.plot(x,yf,'-')

现在，如果我运行这段代码，我会得到一个大致遵循数据的拟合。但是，如果我去掉最初的猜测，即通过调用进行拟合

param,maxfev=100000)

那么拟合就差很多了。原因是 curve_fit 将从初始猜测 [1,1,1] 开始。看起来大致正确的解决方案与 [1,1] 位于不同的山谷中，因此它不是找到的解决方案。换句话说，它只找到局部最小值，而不是全局最小值。

为什么 scipy.optimize.curve_fit 不能为我的点生成最适合的线？

如何解决为什么 scipy.optimize.curve_fit 不能为我的点生成最适合的线？

解决方法

相关推荐