微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

java – ConcurrentHashMap中String intern方法的重复数据删除

我看了一篇来自 JavaDays的代码,作者说这种方法有概率非常有效,可以将类似String的字符串存储到String实习方法
public class CHMDeduplicator<T> {
    private final int prob;
    private final Map<T,T> map;

    public CHMDeduplicator(double prob) {
        this.prob = (int) (Integer.MIN_VALUE + prob * (1L << 32));
        this.map = new ConcurrentHashMap<>();
    }

    public T dedup(T t) {
        if (ThreadLocalRandom.current().nextInt() > prob) {
            return t;
        }
        T exist = map.putIfAbsent(t,t);
        return (exist == null) ? t : exist;
    }
}

请解释一下,这一行中概率的影响是什么:

if (ThreadLocalRandom.current().nextInt() > prob) return t;

这是Java Days https://shipilev.net/talks/jpoint-April2015-string-catechism.pdf的原始演示文稿
(第56张幻灯片)

解决方法

如果您查看下一张幻灯片,其中包含具有不同概率的数据的表格,或者收听 talk,您将看到/听到理由:概率重复数据删除器平衡重复数据删除字符串所花费的时间,以及重复数据删除带来的内存节省.这允许微调处理字符串所花费的时间,甚至在代码周围撒上低概率重复数据删除器,从而分摊重复数据删除成本.

(来源:这些是我的幻灯片)

原文地址:https://www.jb51.cc/java/121139.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐