如何解决按具有错误阈值的数字列分组
我有这个数据框,
输入:
dishID(string) | 食谱(字符串) | Pct(float) |
---|---|---|
一个 | 鸡 | 0.5 |
一个 | 米饭 | 0.3 |
一个 | 西红柿 | 0.2 |
两个 | 鸡 | 0.501 |
两个 | 米饭 | 0.3003 |
两个 | 西红柿 | 0.1999 |
三个 | 牛肉 | 0.5 |
三个 | 米饭 | 0.4999 |
四 | 牛肉 | 0.5001 |
四 | 米饭 | 0.499 |
五 | 鸡蛋 | 0.300 |
五 | 西红柿 | 0.700 |
Def Find_matching_recipe(Threshold = 0.01):
所需的输出:
[[One,Two],[Three,four],[Five]]
使用误差阈值,根据菜谱和相应的百分比将类似菜分组。
我知道如何针对完全相同的百分比(阈值 = 0)执行此操作,但我不知道如何使用错误阈值执行此操作。
它可以是 sql 或 Pandas python。
感谢您的帮助, 如果您有任何问题,请不要犹豫
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。