如何解决使用Spark SQL检测列中的垃圾字符
我有一个表必须在其中一个列中可能包含非ASCII字符的条件。 我必须检测(而不是替换)该列是否具有其中包含非ascii字符的任何值。如果列值包含ascii和非ascii值的组合(例如“ abcקו”),则应检测到垃圾字符的存在。 我必须使用spark sql语句完成此操作。可以这样吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。