微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

两个数据框之间的欧式距离

如何解决两个数据框之间的欧式距离

我想衡量公司之间的可比性。

这是一组可比较的公司及其财务比率,包括几年。

     Year   Cusip9      Name           Total Assets  Long-Term Debt  SIC-Code   
0   2010.0  825690100   SHUTTERSTOCK INC    138630.0    0.0          7375.0 
1   2011.0  825690100   SHUTTERSTOCK INC    248550.0    0.0          7375.0 
2   2012.0  825690100   SHUTTERSTOCK INC    1471140.0   0.0          7375.0 
3   2013.0  825690100   SHUTTERSTOCK INC    2784880.0   0.0          7375.0 
4   2014.0  825690100   SHUTTERSTOCK INC    3837770.0   0.0          7375.0 

这是IPO年份的IPO公司列表。

    Cusip9      Issuer                       IPO Year   Total Assets    Long-Term Debt  Sales      SIC-Code
1   783755101   Ryerson Tull Inc                1996    9322000.0        2632000.0      633000.0   3661
2   826170102   Siebel Sys Inc                  1996    995010.0         0.0            50250.0    2456
3   894363100   Travis Boats & Motors Inc       1996    313500.0         43340.0        23830.0    3661
4   159186105   Channell Commercial Corp        1996    426580.0         3380.0         111100.0   7483
5   742580103   Printware Inc                   1996    145750.0         0.0            23830.0    8473

我现在想找到每个IPO公司财务比率上最接近的欧氏距离。 IPO公司和可比公司的SIC代码应匹配,并且可比公司的IPO年和财政年度也应匹配。因此,最后,我需要在第一个数据框中添加两个新列,包括最近的距离和最近的公司的名称

我是编程新手,完全不了解这项任务。有人有主意吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。