微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

java – 根据其中一个属性删除重复的JSON文件

我的 linux系统中有两个目录,/ dir和/ dir2

两者都有超过4000个JSON文件.每个文件JSON内容都是这样的

{
   "someattribute":"someValue","url":[
      "https://www.someUrl.com/xyz"
   ],"someattribute":"someValue"
}

请注意,url是一个数组,但它始终包含一个元素(url).

该URL使该文件唯一.如果/ dir和/ dir2中存在具有相同URL的文件,则它是重复的,需要将其删除.

我想优先使用shell命令自动执行此操作.任何意见我应该如何去做?

解决方法

使用 jq获取重复列表:

jq -nr 'foreach inputs.url[0] as $u (
    {}; .[$u] += 1; if .[$u] > 1 then input_filename else empty end
)' dir/*.json dir2/*.json

删除它们,请将命令输出上方的管道输出到xargs:

xargs -d $'\n' rm --

或者,为了与具有-0但不是-d的非GNU xargs兼容:

tr '\n' '\0' | xargs -0 rm --

请注意,文件名不得包含换行符.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐