瓜子二手车相关大数据岗位面试题汇总

瓜子二手车面试题

瓜子二手车相关大数据岗位面试题汇总

1）技术部分

（1）优化必问 hive/spark

（2）为什么kafka可以实现高吞吐？单节点kafka的吞吐量也比其他消息队列大，为什么？

（3）如果写了JVM调优：堆内存溢出如何查看解决，用的那些命令工具；CMS和G1有什么不同？

（4）Hive自定义那些UDF函数

（5）Spark那些算子是在map端聚合的

（6）Kafka的偏移量offset存放在哪儿，为什么？

（7）Linux命令查看内存、磁盘、IO、端口、进程

2）算法部分

（1）链表转置/二叉树转置

3）情景部分

（1）一个字符串"jasonbbtomccjackddfftomkk"，如果相邻两个字符相同视为一个切分点，实现WordCount(注意会有多个连续相同的情况如aabbccdd，还有要问清出现三个或者多个怎么算)