如何解决使用EmEditor优化列数据中的排序/去重复多元素
在处理大型带分隔符的文件时,当前最简单的方式是通过/来对列中的元素进行排序/去重复(通常用分号分隔,但可以是任何字符)。
“拆分列方法” document.SplitColumn
,然后使用组合线方法document.CombineLines
重新组合在一起(根据需要使用相关的方法参数进行排序/去重复)。
当文件不是很大时,这种方法行得通,但是我想知道是否存在更快/更优化的方法来对较大的定界文件(百万行)执行此常见任务,特别是通过宏/方法。
解决方法
请将EmEditor更新到v20.1.901或更高版本,并使用以下形式:
document.SplitColumn("3",";",eeSplitIntoNone,"A+",eeRemoveDuplicates | eeSortIgnorePrefix | eeSortStable,0);
这种新的eeSplitIntoNone
类型实际上不会拆分,而只会对元素的重复项进行排序或删除。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。