如何解决将 mark_line 分层到交互式线图上会显着降低 Altair 的性能
这是我创建的一个虚拟数据集来说明我的问题:
import pandas as pd
import numpy as np
import altair as alt
# Use more rows than recommended so it's a bit easier to
# see the slowdown with human eyes.
alt.data_transformers.disable_max_rows()
# Create N rows with 2 columns.
N=10000
test_df = pd.DataFrame({'t' : range(0,N,1),# Integers counting up from 0 to N - 1.
'A' : np.random.randint(0,100,size=N)}) # random integer between 0 and 100.
我用它来创建线图:
test_line = alt.Chart(test_df).mark_line().encode(x='t:Q',y='A:Q').interactive(bind_y=False)
一切都很好,即使有 5000 多行,当我平移和缩放时,呈现的交互式折线图很活泼。这显然与机器有关(即,在不同的机器上运行此代码将导致平移和缩放的性能不同)。
继续前进,我试图画一条垂直线来标记一个兴趣点。该代码的灵感来自 this。
v_rule = alt.Chart(test_df).mark_rule(color='red').encode(x='a:Q').transform_calculate(a=str(5000))
alt.layer(test_line,v_rule).display()
这样,生成的交互式折线图随着屏幕上的垂直线的平移和缩放速度变慢:
如果我四处移动绘图,使得垂直线不在屏幕上,平移和缩放会再次变得活泼。
当我尝试将多个图连接在一起时,这个问题变得更糟,每个图也是交互式的并且有一条垂直线。
有没有更好的方法来绘制这条垂直线?提前预渲染所有内容并保存到本地文件的某种方法?我很惊讶(也很困惑)一条线对渲染速度的影响如此之大。
解决方法
导致性能损失的不是垂直线而是 tranform_calculate
。原因是正在为数据框中的每一行计算值,您可以看到,如果您单击三点操作按钮“在 Vega 编辑器中打开图表”,单击右侧的 Data Viewer
并选择 { {1}}。我相信这也是为什么图中的线看起来有点粗的原因,可能有 10000 条线彼此重叠。
要只创建一行,您可以这样做:
data_1
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。