登录 注册
当前位置:主页 > 资源下载 > 35 > simhash算法的java实现simhash-java.zip下载

simhash算法的java实现simhash-java.zip下载

  • 更新:2024-06-17 09:51:56
  • 大小:1.55MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 开发技术
  • 格式:ZIP

资源介绍

simhash 算法的 java 实现。特点计算字符串的 simhash通过构建智能索引来计算所有字符串之间的相似性,因此可以处理大数据使用使用输入文件和输出文件运行 Maininputfile 的格式(参见 src / test_in):一个文件每行用 utf8 字符集outputfile 格式 start //start flag first line // doc sencode lien // doc1\tdist the dist is the hamming distance between doc and doc1  end //end flag 标签:simhash