如何解决如何将多列中的唯一值设置为键:Pandas DataFrame 生成
早上好!我有一个 DataFrame,我试图按列 SITE 过滤 和可变的。 SITE 列有 273 个唯一名称,SITE 中有 600 多个变量。
我试图通过将空数据帧发送到字典来为每个唯一站点和变量匹配创建一个数据帧。目标是创建一个循环 273*600 = 150000+ 个用于导出的数据帧(图表、.csv 文件等)。
是否可以将唯一的 SITE 和 VARIABLE 行作为单个键一起过滤并吐出过滤后的 DataFrame?这是我尝试过的:
注意:我对 d.keys 和 d.items 应用程序感到困惑 谢谢你的帮助:)
# Get all unique station names and Metal/element variable names from DataFrames
sites = list(set(df['SITE'])) # Unique sites
variables = list(set(df['VARIABLE'])) # Unique variables
# Store filtered DataFrames in a dict using for loop
# name = The name of each water quality station in the SITE column
# Function meaning: For each wq station in the sites list
# create an empty DataFrame
d = {name : pd.DataFrame for name in sites}
for key in d.keys():
d[key] = df[:][df.SITE == sites]
start = datetime.datetime.Now()
i = 0
for key,df in d.items():
len_stations = 274
while i < 274:
station = sites[i]
variable = variables[i]
# Export wq station DataFrames to .csv
df.to_csv(station + '.csv')
print('{} seconds: Exported {} .csv files..'.format((datetime.datetime.Now() - start).seconds,i))
if i == len_stations:
break
else:
i+=1
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。