微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何控制拆解嵌套参数的深度并将其作为单独的参数传递给Python函数?

如何解决如何控制拆解嵌套参数的深度并将其作为单独的参数传递给Python函数?

假设我们有一个NxM阵列。由此,我想将N行解压缩为1xM数组,并将它们作为单独的参数传递给Python函数

一个示例场景是SciPy软件包optimize.curve_fit,它具有相当高的生产率,要求N个自变量必须作为numpy.ravelnumpy.vstack ed NxM数组传递(它们称为xdata),并且fit函数还需要采用单个NxM数组作为参数。显而易见的问题是,几乎所有N维模型函数都被规范地定义为f(x1,...,xN,params) not f(xdata,params)。实际上,optimize.curve_fit甚至要求先对fit函数进行numpy.ravel,即,它希望numpy.ravel(f(xdata,params))而不只是f(x1,params)。谁想到这个...

因此,无论如何,如果不想浪费时间来处理每个曲线拟合的数据结构,则需要一个可以插入optimize.curve_fit前面的小函数来处理这种拆包和重新打包操作( optimize.curve_fit确实应该首先完成这一项工作),以便可以以规范的,数学上干净的方式定义模型函数。拟合数据也是如此,它显然是作为数据点列自然生成的,例如CSV文件中(世界上没有任何测量设备可以生成NxM阵列)。

我已经完成了将长度为M的N个数据列重新打包到这些NxM数组中的工作(如上所述,可以使用numpy.ravelnumpy.vstack)。问题是,如何接口我的健身功能f(x1,params)

如果我这样做

def unpack(f,*args):
    return f(args)

然后Python不会停止将NxM数组拆分为长度为M的N个数组,而是将数组“分解”为一个长度为1的M个数组的N个数组。有没有办法限制拆解嵌套参数的级别?

或者,如果加星标的表达式不起作用,怎么办呢?

def unpack(f,xdata):
    import numpy as np
    N_rows = xdata.shape[0]
    args = [???]    # <=== How to do this,i.e. from N rows generate N arguments?
    return f(args)

更新:在Jake Levi's answer之后,我正在尝试以下方法

def repack_for_curve_fit(f,xdata):
    '''
    This function unpacks the NxM-array with independent data for N predictors into N separate 1xM-arrays,passes them to the fit function as the first N arguments,and returns the flattened fit function for
    further processing with the scipy.optimize.curve_fit package.
    
    Parameters
    ----------
    f : callable
        N-dimensional fit function,f(x1,*params),must take N independent variables as first N
        arguments and the fit parameters as remaining arguments
    xdata : array_like
        NxM-array with independent data for N predictors
    '''
    import numpy as np
    return np.ravel( f(*(x.reshape(1,-1) for x in xdata)) )

但是,我遇到一个错误

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-39-51aaf66438c3> in <module>()
     26     # Do nonlinear curve fit using scipy.optimize.curve_fit,write fit results to TXT file
     27     params_init = (-7,-7,7)    # Specify initial guesses for fit parameters (default is 0)
---> 28     params_opt,params_cov = curve_fit(repack_for_curve_fit(fit_function,xyGrid),xyGrid,imgArrayFlattened,params_init)    # Run the fit,return optimized parameters and covariance matrix
     29     params_err = np.sqrt(np.diag(params_cov))    # Standard deviation of optimized parameters
     30     print(params_opt)

/home/davidra/Desktop/repack_for_curve_fit.py in repack_for_curve_fit(f,xdata)
     14     '''
     15     import numpy as np
---> 16     return np.ravel( f(*(x.reshape(1,-1) for x in xdata)) )

TypeError: fit_function() missing 4 required positional arguments: 'x0','y0','Imax',and 'FWHM'

这是拟合函数

def fit_function(x,y,x0,y0,Imax,FWHM):
    '''
    Parameters
    ----------
    x,y : float
        X and Y coordinates
    x0 : float
        X offset
    y0 : float
        Y offset
    Imax : float
        Peak intensity
    FWHM : float
        Full width at half maximum
    '''
    import numpy as np
    
    return Imax * np.e * 4 * np.log(2) * ((x+x0)**2 + (y+y0)**2) / FWHM**2 * np.exp(-4 * np.log(2) * ((x+x0)**2 + (y+y0)**2) / FWHM**2)

fit_function被证明可以正常工作。问题出在哪里?

此外,我真的需要使用reshape吗?列表/元组理解本身是否已经将xdata数组中的行切出了?

解决方法

您是否正在寻找这种东西,IE将NxM数组中的N行解压缩为1xM数组,并将它们作为单独的参数传递给Python函数,如以下代码片段的底行所示?它使用的是未打包的生成器表达式(但您也可以通过用方括号替换*之后的括号来将其替换为未打包的列表推导)。

import numpy as np

def useful_function(*args):
    """
    This useful function takes N arguments,each of which should be a 1*M array,and prints each argument to the console,along with its shape. N and M are
    both variable.
    """
    for i,a in enumerate(args):
        print("Argument {} is {},with shape {}".format(i,a,a.shape))


n,m = 5,4
n_x_m_array = np.arange(n*m).reshape(n,m)

print("Input NxM array:")
print(n_x_m_array)

useful_function(*(row.reshape(1,-1) for row in n_x_m_array))

输出:

Input NxM array:
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]]
Argument 0 is [[0 1 2 3]],with shape (1,4)
Argument 1 is [[4 5 6 7]],4)
Argument 2 is [[ 8  9 10 11]],4)
Argument 3 is [[12 13 14 15]],4)
Argument 4 is [[16 17 18 19]],4)

您是否对SciPy界面不满意,也许打开一个问题here来讨论这个问题更合适吗?还值得注意的是,如果将序列分解,列表推导,生成器表达式和/或lambda表达式正确组合起来,通常可以很容易地解决许多将输入参数重新格式化为API函数的格式的情况。这些,知道正确的窍门。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。