扫码关注微信公众号

回复“面试手册”,获取本站PDF版

回复“简历”,获取高质量简历模板

回复“加群”,加入程序员交流群

回复“电子书”,获取程序员类电子书

当前位置: 场景题 > 海量数据高频面试题 > 4.有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。

本题和前面的大同小异,首先遍历这10个文件,对每个query进行Hash映射,将这些query重新映射到10个文件,这是为了保证相同的query都在同一个文件中,然后在每个文件中分别使用HashMap统计query的频率,分进行排序,最后通过归并排序将所有文件中的query进行排序


点击面试手册,获取本站面试手册PDF完整版