如何解决Altair:具有自定义分组的数值变量的构面
我有一个学术期刊和各种相关措施的数据集。一种衡量标准是 0-15 级,代表期刊对我们校园的“重要性”(不完美,但仍然如此)。
我想制作一系列散点图,列出使用量 (y) 与成本 (x),然后按层对它们进行分面。我可以使用分面图表,但它可以制作 16 个单独的图表。我找到了一种指定排序顺序的方法,但这似乎只需要字符串(GOOG、MSFT 示例)。
我想要的是基于层组指定分面,层组是数值 - 有一个图表显示数据点的散点图,但仅包含来自 1-4 层期刊的数据。然后另一个只有第 5-8 层,然后是第 9-12 层,然后是第 13-15 层。我似乎找不到指定一组连续值的方法。
cpu_2020_with_1figrTier = alt.Chart(df[filt]).mark_circle(size=75,opacity=0.5).encode(
alt.X('Total Cost:Q',axis=alt.Axis(format='$,.2r'),scale=alt.Scale(clamp=True)),alt.Y('cpu_2020:Q',title='Cost per Use 2020'),#scale=alt.Scale(type='log')
color=alt.Color('1figr Tier:N'),# scale=subscribed_colorscale),#Nominal data type
tooltip=['Title Name','Format','1figr Tier','Total Cost','cpu_2020','Decision'],).interactive().properties(
height=150,title={
"text": ["cpu_2020 vs. Cost,color-coded by 1figr Tier (where available)"],"subtitle": ["Hold"],"color": "black","subtitleColor": "gray"
}
).facet(
row=alt.Row('1figr Tier:N'))
https://ibb.co/YPV84nH 处的当前输出屏幕截图
解决方法
任何时候您想对一个值进行分箱,您都可以使用与制作直方图相同的 bin transform;不同之处在于,分箱不在 x
编码中,而是在 column
编码中。
这里有一个简单的例子来演示这一点,您希望可以修改它以用于您的数据:
import altair as alt
import pandas as pd
import numpy as np
df = pd.DataFrame({
'x': np.random.rand(500),'y': np.random.randn(500),'tier': np.random.randint(0,15,500),})
alt.Chart(df).mark_point().encode(
x='x:Q',y='y:Q',column=alt.Column('tier:Q',bin=alt.Bin(minstep=5))
).properties(width=300)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。