微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

是否有关于如何使用 Antlr 4 解析 SQL 语句的规范示例? 用法,重要提示

如何解决是否有关于如何使用 Antlr 4 解析 SQL 语句的规范示例? 用法,重要提示

我正在尝试使用 Antlr4 为 sql 语句构建解析器。我并不关心我使用哪种特定的 sql 语法,因为我计划强制只允许使用 ANSI sql,但在下面的示例中,我碰巧使用了 T-sql 的语法。这是我的简单代码

String sql = "SELECT ROW_NUMBER() OVER (ORDER BY id) FROM some_table";
TsqlLexer tsqlLexer = new TsqlLexer(CharStreams.fromString(sql));
CommonTokenStream stream = new CommonTokenStream(tsqlLexer);
TsqlParser parser = new TsqlParser(stream);
ParseTree tree = parser.tsql_file();  // errors happen here
ParseTreeWalker walker = new ParseTreeWalker();
// I built a custom listener,so far not much in it
AnalyticFunctionBaseListener listener = new AnalyticFunctionBaseListener();
walker.walk(listener,tree);

生成以下错误/警告之前,代码只会调用 tsql_file()

line 1:35 token recognition error at: 'i'
line 1:36 token recognition error at: 'd'
line 1:44 token recognition error at: 's'
line 1:45 token recognition error at: 'o'
line 1:46 token recognition error at: 'm'
line 1:47 token recognition error at: 'e'
line 1:49 token recognition error at: 't'
line 1:50 token recognition error at: 'a'
line 1:51 token recognition error at: 'b'
line 1:52 token recognition error at: 'l'
line 1:53 token recognition error at: 'e'
line 1:37 no viable alternative at input 'SELECTROW_NUMBER()OVER(ORDERBY)'

显然我在这里遗漏了一些重要的东西,但我不知道那是什么。我使用 ANTLR GitHub site 提供的已发布的 Tsql 语法进行构建。

任何 Antlr 大师都可以修改上面的代码片段以使其正常工作吗?我希望有人能给出一个如何使用 Antlr 解析基本 sql 语句的规范示例。

解决方法

注意 README 中的以下注释:

用法,重要提示

由于 SQL 语法通常不区分大小写,但此语法实现是,您必须使用自定义 character stream 将所有字符转换为大写,然后再将它们发送到词法分析器。

您可以找到更多信息 here 以及各种目标语言的实现。

简而言之,更改您的代码:

String sql = "SELECT ROW_NUMBER() OVER (ORDER BY id) FROM some_table";
TSqlLexer tSqlLexer = new TSqlLexer(CharStreams.fromString(sql));

到:

String sql = "SELECT ROW_NUMBER() OVER (ORDER BY id) FROM some_table";
CharStream s = CharStreams.fromString(sql);
TSqlLexer tSqlLexer = new TSqlLexer(new CaseChangingCharStream(s,true));

在此处查找 CaseChangingCharStream 的来源:https://github.com/antlr/antlr4/blob/master/doc/resources/CaseChangingCharStream.java

编辑

在评论中,迈克建议:

或者,您可以使用 MySQL grammar,它支持不区分大小写的关键字而无需额外的流

这可能是更好的选择。我并不是说 T-SQL 语法不好/不准确,但 Mike 建议的语法来自官方 MySQL 存储库(并且 Mike 对此做出了贡献)这一事实会让我对它的质量充满信心。>

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。