返回 登录
0

Snowflake建造了一个更大,更简单的数据仓库

原文Snowflake builds a bigger, simpler data warehouse
作者:Serdar Yegulalp 翻译:赖信涛 责编:仲培艺

图片描述

基于云端的数据仓库系统Snowflake发布了新的feature,对企业来说更加强大,而且更加简单。

Snowflake由微软的前职员Bob Muglia建立,去年,他们将弹性仓库系统(Elastic Data Warehouse system)开源。这主要是为有分析需求,但是又想免去配置麻烦的用户准备的。

空间(以及速度和方便性)很重要

新的Snowflake坚持默认配置最高性能的原则——即不必用户或者Snoflake配置就可以达到最优化的效果。

其中一个新特性是多数据仓库功能,数据库可以自动从多个数据组聚合数据,来满足请求。如果多个用户发来相似的查询请求,查询结果可以缓存,然后重复使用,对性能进行优化。数据通过自动分享和分隔也大大加快了速度。

在Snowflake刚发布的时候,它并不做数据保护相关的东西。现在,除了自动在多个数据源之间同步数据之外,之前版本的数据也会自动保存一段时间,长短可以由用户设定。

要取回之前的数据,用户不需要存储或手动取回之前版本数据库的副本。它用的是一个特殊的SQL语法——SELECT AS OF--来得到一个之前版本的数据表。其他还有一些特殊的指令,例如CLONEUNDELETE可以将之前版本的数据重建和重新存储。

黑盒操作

Snowflake的CEO Muglia在一次电话中指出,公司如何使用监控系统来实现“不干涉方法”。

“我们利用用户的查询,”他说。“我们不会看用户的数据,他们都被自动加密了。但是我们可合法提取其运行查询的信息。”这足够公司来持续提高算法和查询优化了。

这种系统的一个缺点是,它的查询和所有机件,相比于其它数据库平台是一个黑盒系统。这再次证明了Snowflake平台是一个专利——由客户产生的查询引擎。

Muglia的观点是,公司使用的系统可以让他们不断做出更新,来适应客户的查询请求。

“经常会有用户来找我们说,hey,你能告诉我这次查询出什么问题了吗?”Muglia说,“我们可以很快地向他们解释原因,然后做出反应,满足他们的需求。”

这些反馈反过来让Snowflake的迭代和优化非常迅速。

2016年8月12日-13日,由CSDN重磅打造的互联网应用架构实战峰会运维技术与实战峰会将在成都举行,目前18位讲师和议题已全部确认。两场峰会大牛讲师来自阿里、腾讯、百度、京东、小米、乐视、聚美优品、YY互娱、华为、360等知名互联网公司,一线深度的实践,共同探讨高可用/高并发/高性能系统架构设计、电商架构、分布式架构、运维工具研发与实践、运维自动化系统的构建、DevOps、云上的运维案例分析、虚拟化技术、应用性能检测与管理、游戏行业的运维实践等,将和与会嘉宾共同探讨「构建更安全、更高性能、更稳定的架构和运维体系」等领域的话题与技术。【八折优惠中,点击这里抢票,欲购从速。】

评论