微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何从tree-sitter中的节点获取值?

如何解决如何从tree-sitter中的节点获取值?

如果我的保姆有一个简单的语法:

rules: {
    expr: $ => choice(
        /[0-9]+/,prec.right(seq($.expr,/[+-]/,$.expr)),)
}

和输入:

3+4

我得到以下CST:

(start [0,0] - [0,3]
  (expr [0,3]
    (expr [0,1])
    (expr [0,2] - [0,3])))

所以我的问题是,如何从这些节点/叶中获取值,即所解析的内容。我以某种方式必须评估树。我肯定有办法,因为我也可以使用tree-sitter对我需要的值进行语法高亮显示(我猜)。但是我阅读了文档,却找不到任何说明,该怎么做。

解决方法

Tree-sitter的语法树不存储输入文本的副本。因此,要获取特定令牌的文本,您将必须使用Tree-sitter提供的范围来计算原始源代码的 slices

python binding中,如下所示:

source_code_bytes = b'3 + 4'
tree = parser.parse(source_code_bytes)
node1 = tree.root_node.children[0].children[0]

node1_text = source_code_bytes[node1.start_byte:node1.end_byte].decode('utf8')
assert node1_text == '3'

在某些语言绑定中,例如the wasm binding,有一个.text助手可简化此操作。

an open issue用于将这种辅助函数添加到python绑定中。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。