返回 登录
0

Hadoop十岁了,核心代码行数已170万+、贡献者800+

阅读43326

Hadoop正式诞生于2006年1月28日,它是一个开源项目的生态系统,从根本上改变了企业存储、处理和分析数据的方式。跟传统系统的区别是,Hadoop可以在相同的数据上同时运行不同类型的分析工作。

自2006年2月项目正式启动,短短的十年间,Hadoop逐步发展成为最近十年来最成功的开源社区的历程。

  • 核心Hadoop中目前的代码行数:170万+
  • 自2006年来对Hadoop的提交数量:12000+
  • 自2006年来对核心Hadoop的代码贡献者:800+
  • Hadoop生态系统中的项目数量从2006年的2个到了25个

总有那些时间节点事件让你难以忘却:

  • 2006年1月,Hadoop之父Doug Cutting加入雅虎;
  • 2006年1月,Cutting将Hadoop代码从Nutch中剥离作为一个新的子项目(常被称作Hadoop“创世纪”事件);
  • 2006年3月,Yahoo!创建了其第一个Hadoop研究集群;
  • Google发布了最初的BigTable论文《Cutting:用于结构化数据的一个分布式存储系统》,启发了Hbase的创建;
  • 2008年1月,Hadoop成为了Apache顶级项目;
  • 2008年7月,Hive,第一个Hadoop的SQL访问框架(由Facebook发明),成为一个新的Hadoop子项目;
  • 2008年8月,Apache的Pig发布,第一个Hadoop的高级别非SQL框架;
  • 2010年5月,Hbase,自HDFS以来第一个新的数据存储项目,成为Apache顶级项目;
  • 2012年3月,HDFS HA,做为企业级应用的重要一步,并入了Hadoop支干项目;
  • 2012年8月,YARN(也是企业级应用的重要里程碑)成为Hadoop的子项目;
  • 2014年1月,Apache Spark,Hadoop新兴的默认执行引擎(MapReduce的补充),成为Apache的顶级项目;
  • 2015年10月,Kudu,自HBase以来第一个新的Hadoop存储项目,加入了生态系统;
  • 2015年11月,Impala和Kudu成为Apache孵化项目;
  • ……

如今,Hadoop已被公认为是目前最流行的大数据处理平台。Hadoop生态圈的各个项目,围绕着大数据的存储、计算、分析、展示、安全等各个方面,构建了一个完整的大数据生态系统,如今HDFS、YARN等项目更成为海量数据存储和计算资源调度上的事实标准。

在春节即将到来之际,CSDN将在2016年1月29日16:00-20:30,于北京组织“Hadoop英雄会——暨Hadoop 10周年生日大趴”(上海将在3月份举行,敬请期待),将汇聚所有热爱开源,热爱大数据,热爱Hadoop的技术人,共同为Hadoop庆生,一起见证Hadoop诞生十年后的技术实战与趋势。

Hadoop 10周年生日大趴(北京站)

首先技术大牛论道,Hadoop之父Doug Cutting致10岁生日(视频),除此之外参与的大牛还有:中科院计算所副研究员、中国大数据技术大会(原Hadoop in China)发起人查礼带来《Hadoop技术回顾与展望》的分享;Hulu高级研发工程师董西成的《Hadoop YARN程序设计与应用案例》;也有Cloudera资深技术工程师分享《Hadoop最新技术》;明略数据资深工程师梁堰波《SQL on Hadoop的历史、现状与未来》;以及AdMaster技术副总裁卢亿雷的《Hadoop应用及趟坑》。

在深度技术分享之后,也有着大型的Hadoop生日晚宴,还有各类豪礼大奖(成功避过年会大奖的可以看过来):

  • Kindle Paperwhite
  • SKG 原汁机
  • 索尼音乐魔方 迷你音响
  • 百草味 富贵开坚果礼盒
  • 百草味 富贵开坚果礼盒
  • 360智能摄像机 小水滴
  • 百草味 富贵开坚果礼盒
  • 百草味 富贵开坚果礼盒
  • 百草味 富贵开坚果礼盒
  • 百草味 富贵开坚果礼盒

活动报名地址:Hadoop英雄会——暨Hadoop 10周年生日大趴

评论