大数据和云计算技术周报(第56期)
本期会给大家奉献上精彩的:HBase、Zookeeper、模型引擎、云上架构、Spark、Kafka、StreamSets、es+hadoop、Redis、RocketMQ、Tengine、MySQL。全是干货,希望大家喜欢!!!
#大数据和云计算技术社区#希望通过坚持定期分享能帮助同学在大数据学习道路上尽一份微博之力。相信长期坚持认真阅读周报的同学,在技术的道路上一定会日益精进!感谢编辑们的长期坚持!也请同学们继续打赏,支持社区,支持编辑们持续奉献高质量知识!
#大数据和云计算技术社区#长期招募有兴趣参与社区编辑和运营的同学,欢迎扫描文末二维码联系(参与社区工作,收获知识和进步,还有红包哦)。
特别提醒,文末有惊喜!
以下是正文,限于众编辑水平有限,不保证大家都喜欢。
1HBase①随着越来越多的业务选择HBase作为存储引擎,对HBase的可用性要求也越来越高,对于HBase的运维也提出了新的挑战。目前运维集群超过30+,而且接入的业务类型繁多,对于性能要求也不完全一样,这是今年面临的问题。从15年开始,结合京东的业务情况,基于大数据平台,实现用户接入使用全流程自动化。
http://bigdata.51cto.com/art/201701/528383.htm
②本文对Meet Up交流会上滴滴团队分享的专题进行总结,主要围绕HBase特性应用与内核改进,Phoenix改进与实践,GeoMesa应用简介与展望,稳定性&容量规划四个方面进行了详解。滴滴有很多值得学习的地方,推荐一看。
http://click.aliyun.com/m/1000001132
①最近复习了一下索引,找到了这篇文章,作者把索引的原理讲解的非常透彻,现在研究开源NoSQL产品的比较多,比如HBase,本质上就是在分布式文件系统上建立索引库。所以理解索引对于各种类型的数据库都很重要。
http://blog.codinglabs.org/articles/theory-of-mysql-index.html
②mysql 8.0和pg10对比
https://mp.weixin.qq.com/s/AYDaH8doa-8Y60ILzWKqNg
本文从外围介绍一下Zookeeper是一个什么样子的服务和我们为什么需要这样一种服务
https://www.cnblogs.com/yuyijq/p/3391945.html
模型引擎是携程数据服务组对日常开发工作经验的总结和升华,从最贴近实际的场景出发,为模型上线的各环节提供便利。同时,作为一个综合性平台,模型引擎也从特征质量监控、模型调用监控等方面完善了对模型服务质量的把控。
https://mp.weixin.qq.com/s/KrXAKoDh3kohqaMAXfD1bQ
云上搭建架构不单单需要考虑到性能和可用性,还有安全性、可管理性、弹性等层面都需要注意,实际工作中每一个环节都需要顾及到。
https://mp.weixin.qq.com/s/vJVq1VcoZMkRxLqhcVqjQQ
本文讲解了如何利用Spark框架来实现分布式学习。首先介绍了Spark与深度学习相关的几个核心概念,接着列举了几个开源的深度学习案例,这些开源案例对我们深入学习深度学习大有裨益。
https://towardsdatascience.com/deep-learning-with-apache-spark-part-1-6d397c16abd
本文主要介绍了Kafka High Level Consumer、Consumer Group、Consumer Rebalance、Low Level Consumer实现的语义和适用场景。以及未来版本中对High Level Consumer的重新设计–使用Consumer Coordinator解决Split Brain和Herd等问题。
https://mp.weixin.qq.com/s/zheqluaR4IY-NVqbE3MXiQ
本篇文章Fayson主要介绍如何使用StreamSets实时采集Kafka的数据并将采集的数据写入Hive,StreamSets的流程处理如下:
https://mp.weixin.qq.com/s/xcJYxv_8ncS9lqVFlwlHkQ
es+hadoop最佳实践,实时分析你的数据
https://www.linkedin.com/pulse/elasticsearch-hadoop-best-two-worlds-real-time-analysis-anshul-verma
在介绍 RDB 和 AOF 方案时,不仅介绍它的作用及操作方法,同时介绍持久化实现的一些原理细节及需要注意的问题。最后,介绍在实际使用中,持久化方案的选择,以及经常遇到的问题等。
https://mp.weixin.qq.com/s/ad7DwTPGpACJ34pmP1y_mQ
消息队列之 RocketMQ,从原理到实践,让你对消息队列有不一样的认识
https://mp.weixin.qq.com/s/hSidgPDbIB4hvVq5Pvlvtw
Tengine是由淘宝网发起的Web服务器项目。它在Nginx的基础上提供了更加强大的支持,相信会有更好的发展
https://mp.weixin.qq.com/s/CaV0RmhEM3aMvo6a_btOYw
好不容易带个女朋友回家,结果第二天就跑了!
尼玛……害我装了一个空调,我容易吗我?
致谢:
周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞、魏宏斌
猜你喜欢
加入技术讨论群
《大数据和云计算技术》社区群人数已经3000+,欢迎大家加下面助手微信,拉大家进群,自由交流。
喜欢QQ群的,可以扫描下面二维码:
欢迎大家通过二维码打赏支持技术社区(英雄请留名,社区感谢您,打赏次数超过108+):