在100G文件中找出出现次数最多的100个IP,要求ip和次数都精确

1. 刚开始自己想的是文件分100个桶,桶里取排序前1000,后来手动证明此算法有误

2.后来想到可以另外取100个文件桶,将ip存到(ip) % 100的桶里。最后对各个文件读入内存,上hashtable即可

 

在100G文件中找出出现次数最多的100个IP,要求ip和次数都精确