大数据基础认知
一、重点01
理解他们之间的关系以及这个技术的发展趋势
- 数据部分
- 数据存储
- 怎么优化存储
- 数据传输
- 数据来源
- 数据处理
- 数据计算
- 面向服务器分布式协调
- 计算的协调
3.框架的进阶 - spark
- flink
4.面向大数据语言的进阶
- java
- scale
二、重点02
面试的技能点
三、我提出的问题
1.
2.
3.
4.
5.不太明白面向对象的意思?
6.Hbase的列式存储是什么意思?
7.全球分布式的资料-时间不同步的问题?
四、解答
- Maven项目可以帮助我们自动导包,保存管理好相关的依赖包以及他们的版本
- 组名,一般为公司的域名加上你的部门像 :org.Apache.
- 区分各个目录的功能,设置成源码目录,他就能识别,你这个目录下放的是源代码
- 不是,类名,自己起,首字母大写,需要见名知意
- java面向对象是一种编程的思想
- 读写速度比较快
- 理论上使用原子时钟同时进行
五、拓展资料
- 谷歌三剑客 链接:https://pan.baidu.com/s/15OlBPi8Or3aXmyg1SkKqKA 提取码:sgum
- 全球分布式计算