如何解决Altair散点图添加不需要的行
当分层放置在热图上方时,仅当点值也在热图的轴上时,altair散点图才似乎起作用。在其他情况下,将沿x和y值添加白线。这是一个最小的示例:
import streamlit as st
import altair as alt
import numpy as np
import pandas as pd
# Compute x^2 + y^2 across a 2D grid
x,y = np.meshgrid(range(-5,5),range(-5,5))
z = x ** 2 + y ** 2
# Convert this grid to columnar data expected by altair
source = pd.DataFrame({'x': x.ravel(),'y': y.ravel(),'z': z.ravel()})
c = alt.Chart(source).mark_rect().encode(
x='x:O',y='y:O',color='z:Q'
)
scatter_source = pd.DataFrame({'x': [-1.001,-3],'y': [0,1]})
s = alt.Chart(scatter_source).mark_circle(size=100).encode(
x='x:O',y='y:O')
st.altair_chart(c + s)
有什么办法可以防止这种行为?我想稍后为这些点设置动画,因此不能将值添加到热图轴。
解决方法
序数编码(用:O
标记)将始终创建一个离散轴,每个唯一值只有一个bin。听起来好像您想使用定量编码(用:Q
标记)来可视化数据,从而创建一个连续的实值轴。
但是,在热图的情况下,这会使事情变得复杂:如果您不再将数据视为有序类别,则必须指定沿每个轴的每个bin的起点和终点。这需要对您的垃圾箱表示什么进行一些思考:值“ 2”是否表示从2到3的数字?从1到2?从1.5到2.5?答案将取决于上下文。
下面是一个使用calculate transform计算这些容器边界的示例,假设这些值代表单位容器的中心:
c = alt.Chart(source).transform_calculate(
x1=alt.datum.x - 0.5,x2=alt.datum.x + 0.5,y1=alt.datum.y - 0.5,y2=alt.datum.y + 0.5,).mark_rect().encode(
x='x1:Q',x2='x2:Q',y='y1:Q',y2='y2:Q',color='z:Q'
).properties(
width=400,height=400
)
scatter_source = pd.DataFrame({'x': [-1.001,-3],'y': [0,1]})
s = alt.Chart(scatter_source).mark_circle(size=100).encode(
x='x:Q',y='y:Q'
)
st.altair_chart(c + s)
或者,如果您希望这种装箱更自动进行,则可以在每个轴上使用bin变换:
c = alt.Chart(source).mark_rect().encode(
x=alt.X('x:Q',bin=True),y=alt.Y('y:Q',y='y:Q'
)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。