在100G文件中找出出现次数最多的100个IP,要求ip和次数都精确
1. 刚开始自己想的是文件分100个桶,桶里取排序前1000,后来手动证明此算法有误
2.后来想到可以另外取100个文件桶,将ip存到(ip) % 100的桶里。最后对各个文件读入内存,上hashtable即可
1. 刚开始自己想的是文件分100个桶,桶里取排序前1000,后来手动证明此算法有误
2.后来想到可以另外取100个文件桶,将ip存到(ip) % 100的桶里。最后对各个文件读入内存,上hashtable即可