非常简单的simhash,采用的hanlp的第三方库进行的分词和词性标注,hash计算是最简单的网上的那些形式,适合用来处理大文本
数据源当然可以自己换成redis
博客介绍 https://blog.csdn.net/singgel/article/details/106575438
| Name | Name | Last commit date | ||
|---|---|---|---|---|
非常简单的simhash,采用的hanlp的第三方库进行的分词和词性标注,hash计算是最简单的网上的那些形式,适合用来处理大文本
数据源当然可以自己换成redis
博客介绍 https://blog.csdn.net/singgel/article/details/106575438