瓜子二手车相关大数据岗位面试题汇总
瓜子二手车面试题
1)技术部分
(1)优化必问 hive/spark
(2)为什么kafka可以实现高吞吐?单节点kafka的吞吐量也比其他消息队列大,为什么?
(3)如果写了JVM调优:堆内存溢出如何查看解决,用的那些命令工具;CMS和G1有什么不同?
(4)Hive自定义那些UDF函数
(5)Spark那些算子是在map端聚合的
(6)Kafka的偏移量offset存放在哪儿,为什么?
(7)Linux命令 查看内存、磁盘、IO、端口、进程
2)算法部分
(1)链表转置/二叉树转置
3)情景部分
(1)一个字符串"jasonbbtomccjackddfftomkk",如果相邻两个字符相同视为一个切分点,实现WordCount(注意会有多个连续相同的情况如aabbccdd,还有要问清出现三个或者多个怎么算)