海量日志数据存放在一个超大的文件中无法直接读入内存,要求找出某天访问百度次数最多的 IP。 | JR Academy

海量日志数据存放在一个超大的文件中无法直接读入内存,要求找出某天访问百度次数最多的 IP。

难度: hard

标签: hash partition, frequency count, map-reduce idea, external processing

登录后查看完整答案