返回 登录
30

Hadoop 2.x beta版发布

Arun C Murthy(Hortonworks创始人,Hadoop 2开发的领军者)在邮件列表中发布了这一消息。很快,他又在Hortonworks的官方博客发表文章,做了更详细的说明。

Hadoop 2.x是这个大数据核心平台的一次重大改版,将原来HDFS+MapReduce的架构重构为HDFS2+YARN(集群资源管理中间层)+上层服务(包括MapReduce, Tez, HBase on YARN (HOYA), Storm-on-YARN, Samza, Spark, OpenMPI等等)。

如今,作为Hadoop 2.x的第一个beta版,Apache Hadoop 2.1.0-beta的发布,意味着Hadoop 2.x的正式版也不远了(Murthy已经明确表示解决最后遗留的7个问题,还需要数周时间,希望能在9月中旬发布GA版)。官方发布公告表示,鼓励用户立即迁移到这一版本,因为稳定性大大提高,而且API和连接协议(wire protocol)都经过考验,会与未来兼容。

重要更新包括:

  • HDFS和YARN的API都已经稳定(详情参见HADOOP-8990YARN-386
  • 实现了与Hadoop 1.x MapReduce应用的二进制兼容(详情参见MAPREDUCE-5108
  • 支持在Windows 上运行Hadoop(详情参见HADOOP-8562
  • HDFS瞬像(详情参见HDFS-2802
  • HDFS支持NFS-v3访问(详情参见HDFS-4750
  • YARN应用开发者的客户端API(详情参见YARN-418
  • 与Hadoop生态系统中系统项目(Apache HBase, Apache Pig, Apache Hive)之间做了大量集成测试

详细的版本发布说明在这里

Zhijie Shen和Vinod Kumar Vavilapalli也适时地发表了一篇文章,介绍如何在Hadoop新版上运行原有的程序

评论