微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Java编程实现用hash方法切割文件

Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要函数

如果有大型数据文件(如每行为url或者ip或者单词等的),以G为单位的,处理的时候需先切分。普通切分方法直接根据数据条数切分,得到的每个文件大小相近。

但是有时需要将相同数据放到相同文件中。可以使用hash切分法。

public class Test { 
   
  static int HASHLEN = 1000; 
   
  public static void main(String[] args) { 
    // Todo Auto-generated method stub 
    String words [] = {"yes","an","go"}; 
    for(String word:words){ 
      int temp = hash(word.tochararray()); 
      System.out.println(temp); 
    } 
  } 
  public static int hash(char[] word) { 
    int index = 0;  
    int i=0; 
    while(i<word.length) { 
      index += index * 31 + word[i];  
      i++; 
    }  
    return index % HASHLEN;  
  }  
} 

总结

以上就是本文关于Java编程实现用hash方法切割文件的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐