瓜子二手车相关大数据岗位面试题汇总

瓜子二手车面试题

 

瓜子二手车相关大数据岗位面试题汇总

 

1)技术部分

(1)优化必问 hive/spark

(2)为什么kafka可以实现高吞吐?单节点kafka的吞吐量也比其他消息队列大,为什么?

(3)如果写了JVM调优:堆内存溢出如何查看解决,用的那些命令工具;CMS和G1有什么不同?

(4)Hive自定义那些UDF函数

(5)Spark那些算子是在map端聚合的

(6)Kafka的偏移量offset存放在哪儿,为什么?

(7)Linux命令 查看内存、磁盘、IO、端口、进程

2)算法部分

(1)链表转置/二叉树转置

3)情景部分

(1)一个字符串"jasonbbtomccjackddfftomkk",如果相邻两个字符相同视为一个切分点,实现WordCount(注意会有多个连续相同的情况如aabbccdd,还有要问清出现三个或者多个怎么算)

大数据培训