返回 登录
0

专访七牛云技术总监陈超:浅谈开源技术选型考量

阅读23436

编者按:最近一次见到陈超(@CrazyJVM,七牛云技术总监)是在SDCC架构和数据库峰会的上海站,当时他给大家带来的是一个时间序列数据库的话题——“InfluxDB”。这是一个令人映像深刻的分享,因为在演讲中,陈超给大家分享了他们对大量时间序列数据库的认识,为技术选型迷惘的同学送上了非常不错的参考。当然,在这个演讲中,InfluxDB是重头戏,陈超不仅做了技术的深入解析,更分享了它的演变历史,详情可以参考之前的PPT。而在技术分享之外,我们还从他口中得知,现在他团队好多同学都是InfluxDB的活跃贡献者,而促成的主要原因就是该开源数据库在投入生产环境使用中有很多bug需要修补,就像他说的,自己挖的坑,怎么样都得填掉,其次就是对社区回馈的精神。

谈到开源技术,陈超在另一个社区中可能为更多人知道,那就是Apache Spark,因为他是国内最早的布道者之一。而在此之外,在由CSDN主办源于2014年的中国Spark技术峰会中,陈超已经是2015、2016两届峰会的出品人。那么,作为开源技术的资深实践者,陈超又会有一些什么样的秘诀,下面走进2016中国Spark技术峰会笔者对他的专访。

图片描述

七牛云技术总监 陈超

CSDN:首先请介绍一下自己,及现在负责的事情。

陈超:大家好,我是陈超,目前在七牛云负责数据产品设计与研发方面的工作。

CSDN:到七牛云,你基本上是从零开始组建了自己的团队,而大数据玩家一般都面对一个招人难的现状,你是如何解决这个问题的?其次,带一个全新的团队,有什么经验可以给大家分享?

陈超:到七牛云我确实面临着从零开始组建团建的情况,“招人难”我觉得是相对的,实际上,我并不十分care候选人过去的domain,只要他们够聪明、够拼,最好有那么一点小理想,那我觉得这就是我想找的人。全新团队的经验,其实也就是团队管理那些事情了,不过过去一年中,我在remote working的管理上面确实也积累了一点心得,这个以后有机会单独再交流吧。

CSDN:你一直都在尝试不同的开源技术,是否可以在开源技术考量上给大家一些意见?

陈超:从个人角度,那没什么好说的,你喜欢玩什么开源都行。但从团队的技术选型上讲,首先就是看这个技术是否确实能解决你的需求,使用界面(这里指交互接口)是否足够清晰与优雅,另外还要看你的team能否hold住它,最后,永远选择社区活跃的开源项目。

CSDN:开源技术的发展是依赖于用户对社区的反馈,那么用户都可以做些什么来帮助一个开源技术的发展?

陈超:开源的最大魅力之一就是大家一起帮助这个项目越做越好。用户想提供帮助,那首先你得用它,你不真正使用它很多问题是很难暴露出来的,遇到问题后,就尽量解决这个问题,提patch反馈给社区。当然,另一层面是你可以独立完成一个feature或者一个模块的一部分提交给社区。最后,优秀的布道师也可以大大促进社区的发展。

CSDN:你是Spark国内最早的布道者之一,是否可以给大家谈谈Spark这个技术在近几年的发展?

陈超:这其实是个很大的问题,我简单谈下。在最开始的时间,Spark肯定是以运行效率与运行稳定性为第一要务,并且Spark在这方面确实做的越来越好。但随着Spark的发展,以及越来越多的用户选择Spark,现在Spark也在使用界面(仍然指API界别)上做了很多努力,譬如DataFrame及DataSet的诞生。这一块Ram在讲Spark 2.0的时候应该会着重提出,我就不再这里对赘述了。

CSDN:作为一个高速发展中的开源项目,其不定性和稳定性仍然存在一些问题,你认为用户该如何对待这个状态?

陈超:这是很正常的情况。特别是那些处于早期的开源项目,问题经常是非常多的,那这个时候你就应该考虑下,是否真的需要这么快就使用它,事实上大多数时间是可以等它更成熟点再使用。开源项目,最怕的不是有问题,而是有问题,没人讨论或者没人回答,所以我前面讲,一定要选择社区活跃的开源项目。

CSDN:给大家分享一些秘诀吧,比如在Spark是用过程中遇见无法解决的问题该如何去寻找答案?

陈超:寻求社区帮助,你遇到的问题极有可能别人已经遇到了,即使没遇到,大家也可以一起讨论。

CSDN:你是中国Spark技术峰会两届的出品人,本届峰会的议题策划你都是出于哪些考虑?

陈超:本次我着重考虑三点,一是希望给大家传递Spark发展中一些比较前沿的信息,二是Spark与其它生态结合的一些案例,第三就是工业界有影响力的应用。

CSDN:请对议题做一个简单的解读,都适合什么样的人来听。

陈超:本次议题可以说是非常丰富的。无论是Spark初学者,还是有一定使用经验的朋友,都可以来一起交流下。当然,如果你还在对于是否使用Spark犹豫不决,那就更建议来现场听一听,大家一起交流下。

由CSDN重磅打造的2016中国云计算技术大会(CCTC 2016)将于5月13日-15日在北京举办,大会特设“中国Spark技术峰会”、“Container技术峰会”、“OpenStack技术峰会”、“大数据核心技术与应用实战峰会”等四大技术主题峰会,以及“云计算核心技术架构”、“云计算平台构建与实践”等专场技术论坛。80+位一线互联网公司的技术专家将到场分享他们在云计算、大数据领域的技术实践,目前大会剩票不多,欲购从速。详情请点击CCTC 2016大会官网

评论