也说MinHash

之前突然想看看实时推荐系统有什么文章,看到Google文章中提到MinHash,然后看到xlvector的blog中还有网上也搜到其他一些blog中也有提到。它可以用来加速计算相似度,对于大规模数据,速度非常快。

Continue reading »