返回 登录
0

SDCC 2016北京站精彩PPT纵览:帝都风云,王者之姿

SDCC 2017·上海站将于2017年3月17-19日登陆申城,三大技术峰会和24位嘉宾,汇聚国内知名的互联网公司CTO、架构师、技术总监,畅谈运维、数据库和架构的热门话题和技术热点,遇见精益运维发起人&优维科技CEO王津银、MongoDB大中华区首席架构师唐建法和腾讯手Q后台架构师孙子荀等大牛。截止3月5日前门票八折优惠中,5人以上团购立减1500元,详情点击注册参会

图片描述

回首2016,SDCC走过上海、深圳、成都、杭州、北京诸站,以绝对干货的技术分享赢得爆棚人气,可谓口碑与关注度齐飞。其中,年终盛会北京站更是汇集各路牛人大咖,以技术会友,瞄准不同分支及侧重点,为广大技术爱好者度身打造诚意满满的年度盛宴。现在,让我们一同回顾北京站的精彩瞬间,压缩式大容量干货整装待发,你准备好了吗?

Erlang之父 Joe Armstrong:如何设计高可靠的分布式并行系统(PPT下载

Joe Armstrong以其30年的并行编程经验切身探讨了并行编程优于顺序编程的诸多方面,包括简易性、统一性、以及可靠性。Armstrong先生表示,现实世界是并行的,计算机程序也应该遵循现实世界并行的物理规律。并行计算的简易性体现在并行编程只需模拟外部世界的运转模式,“无需多动脑筋”;统一性和可靠性体现在其能够实现计算机内部的相互备份与支持,当一个模块发生故障时,其他模块能够无缝接手其工作。在现场,Armstrong先生以电梯控制系统为例说明如何编写并行程序。最后,Armstrong先生为开发者介绍了学习Erlang的方法以及相关书籍。

ThoughtWorks中国区CTO 徐昊:技术雷达之 PaaS 容器即进程,PaaS 即机器,微服务架构即编程模式(PPT下载

在过去五年里,云已经成为真正意义上的“The de facto platform”,如何在实践中真正拥抱这样一个平台的变化是整个行业都在思考的命题。我们能够看到,行业内许多所谓的云化操作仅仅只是简单的迁移替代。云和内核虚拟化存在着什么样的差异?在我们使用 AWS 等设施时,就是在使用云?而虚拟化和云之间存在的一大鸿沟就是完全拥抱云平台给我们带来的弹性。大家狂热地强调自动化部署,但对于应用而言,真正的问题是,是否能够发挥云的最大效果,能否真正利用云平台带来的好处。

蚂蚁金服高级研究员 阳振坤:关系数据库的困境与出路(PPT下载

毋庸置疑,数据库是最关键的基础设施。关系数据库系统发展至今依旧繁荣,但仔细想来,现存的多为早前建立下来的基础,如今的关系数据库存在诸多问题和挑战。面对这一发展现状,是偏安一隅苟延残喘,还是做出一些大胆的尝试?实际上,关系数据库仍然有非常大的发展空间。互联网时代迎来信息的大膨胀,传统关系型数据库的缺陷逐渐浮现,甚至一度有关系数据库日落西山的言论盛行。那是什么让其遭遇今日之困呢?其一,为门槛高,这里就类似先有鸡还是现有蛋的问题,因为出一点问题整个系统即无法工作,所以性能对数据库而言永远是巨大的挑战,然而即使能证明性能,做一个新的系统也往往没去用,因为无法证明其稳定可靠。其二,是成本,商业数据库需要负担极高的服务费这一点也是众所周知的。其三是扩展性差,如双十一和 一些爆火的游戏或App都有可能面对访问骤增的问题,难于扩容,小引擎支撑不了大数据,还有主库故障问题等。对此的对策有降低成本、水平扩展以及自动无损恢复等。而OceanBase即是基于以上思考的大胆实践。

京东搜索部平台部负责人 王春明:京东搜索架构演进之路(PPT下载

分享涵盖搜索产品简介、搜索架构演进之路、搜索应对1111之道、搜索的挑战四方面内容,从微观角度分析搜索系统的架构设计及如何满足突发需求。王春明首先将电商搜索与大搜索相比较,表明电商数据具有结构化、召回率高、信息时效性高及用户个性化需求高等特点。通过介绍搜索架构在四个不同阶段的不同性能,详细阐述了搜索架构应如何满足这些需求。随后分享了搜索如何应对1111,提出面临的主要问题:高并发查询、低延时、海量数据&实时更新、复杂的排序模型、个性化需求,还涉及部署结构、搜索服务流程、三级缓存、托底系统等内容。最后总结阐述了时下搜索系统所面临的复杂挑战。

滴滴出行技术研究员 许令波:思维模式的转变,从工程师到架构师再到技术TL(PPT下载

从阿里到滴滴出行,许令波的丰富经历是其有很多架构师方面的感悟与大家分享。从普通的工程师到架构师,从架构师再到技术TL,他认为架构师需要知道如何从内在思维上提升自己:第一、职场新人要成长成为架构师如何先做事再做人、与人协作、如何了解老板希望你的、如何善于发现兴奋点;不仅是技术上的修炼,与老板以及合作伙伴都要协作上注意实现别人的想法。第二、做好架构师角色外要成长为一个技术TL如何从利己到利他、多提建议少出解决方案,TL要成为工程师和架构师的坚强后盾,需要把公司的目标、老板的目标中与团队成员的成长进行对接。最后,许令波阐述了“对上不要脸,对同级不要脸,对下属不要脸”三个不要脸的原则。

百度外卖架构师 陈霖:百度外卖交易系统高可用实践(PPT下载

百度外卖从2014年后,业务每天、每时都在经历高速的发展,技术架构在业务的发展中逐步锤炼升华。交易系统作为外卖业务最核心的系统,承担着全平台的交易管理,作用不言而喻。因此确保交易系统高可用则是团队的最核心目标,整个研发团队一直都在为了实现整体服务的高可用而持续努力,在这个过程中,团队进行了很多技术创新和尝试,其中大多数技术尝试都在持续为在线业务的高可用保驾护航。演讲从大型O2O交易系统的设计思路和方案、在线业务系统如何设计才能确保高可用,以及如何在开发测试流程中降低系统高可用风险这三部分内容入手,重点分享团队积累的实战经验。

链家网平台化架构师 吕毅:链家网大数据平台架构变迁(PPT下载

链家网大数据部门已成立一年多,之前的一年间从无到有,支持了公司与集团各项数据报表需求。面对公司业务线的发展、运营体系猛增的数据需求,大数据平台的构建解决了这一问题,将原有的人工开发定制报表模式改造为数据全自助平台化模式。链家属于非物联网公司,对运营需求的压力很大。链家网数据相关的工作涵盖科学、应用、产品、数据四大方面,整个数据架构形成了业务的闭环。平台层包括数据服务,Data analysis、Adhoc query、Data Api;工具链,Data engines、ETL system、Management control;集群,Data Security、Resource isolation、Calculate ability。通过一系列的架构演进,链家数据部门从提供数据报表的架构,完成了大数据治理需求的转变。

优维科技联合创始人 王津银:应用,运维管理的核心维度(PPT下载

王津银开场就讲述了当前运维的困境,他表示,传统的从IT模式看运维将会看到处处都是“部门墙”,因此,我们应该从新的角度看待运维,重点思考以下几个问题:ITSM,IT和业务的距离真的近了么?IT真的做到敏捷了么?CMDB为什么鲜有成功案例?为什么才意识到IT自动化的价值?而由于CMDB系统要实现向资源管理系统的过度,应用的变更场景最终是对资源的变更,应用的状态最终是由其资源的状态来决定的,因此,持续交付的核心是应用管理,而运维就应该从持续交付,持续部署开始,重点关注应用管理。最后,王津银分别从应用的资源管理视角、应用的动作管理视角、应用的状态管理视角、应用的平台管理视角详细讲解了如何突破运维困境。

Fit2Cloud联合创始人兼CTO 刘涛:云时代的DevOps自动化运维(PPT下载

DevOps自动化运维的发展经历了三个时代:静态基础设施时代,可编程基础设施时代和容器时代。DevOps自动化运维的现状处在三种状态:混合云多云是多数企业的选择,企业基础设施形态为混合云多云混合IT形态;应用负载分布在物理机、虚拟化平台、公有云、私有云、容器云;多数企业上云后应用直接运行在IaaS,而不是PaaS、容器云。云DevOps的需求目标: 是实现混合云混合IT环境下DevOps高效自动化运维。云DevOps自动化运维的关键技术和策略包括五点:(1)以应用为中心DevOps自动化工具;(2)自动化部署规范和框架;(3)集成开放扩展能力;(4)同构异构基础设施全栈编排自动化;(5)同构异构基础设施统一对接。

亚信大数据云平台负责人 叶鹏:基于Kubernetes的大数据服务能力供给之道(PPT下载

大数据技术的不断快速更新,需要新的技术来支持,而微服务时代大数据服务是否还要单体、大数据服务的供给如何满足DevOps的要求是我们面临的核心问题。叶鹏认为,通过容器和K8S部署大数据服务可以较好的解决这个问题,接着叶鹏讲解了Docker和容器,Docker给开发、交付带来的变化。他在分享中结合Spark集群部署实力,深度剖析Kubernetes的技术架构、常见的大数据服务部署模型、大数据服务编排的基础条件以及编排中常用的K8S组件。

NABA北美区块链协会联合发起人 谭磊:区块链和分布式数据库(PPT下载

谭磊在演讲中指出区块链接是一个复杂的概念,并阐述了他对区块链的理解。区块链就是区块的链,通过树的方式链接,且每个节点上的数据是一致的。 区块链系统是不可篡改的,若篡改某个节点,其后的节点都要做出一致修改。比特币是区块链的1.0,而更有意思的是区块链2.0,它是Distributed(分布式的)、Autonomous(自治的,共同约定的)、Contractual(按照合约执行的)、Trackable(可追溯的)。谭磊表示,区块链要真正的实用,必须与大数据相结合,方式有两种,大数据的区块链和区块链的大数据化。有价值的区块链系统应包含三层架构,即区块链业务应用层、区块链引擎层、分布式数据库存储层。

百度高级软件架构师 颜世光:百度万亿量级数据库的构建与应用(PPT下载

颜世光在主题演讲中表示,面对Hadoop的线性扩展问题、时效性问题,百度推出了自己的解决方案,即海量实时数据库Tera。它实现了自动伸缩且稳定可靠,采用自动负载均衡技术,区间可自动分裂、自动迁移、在线合并。在Tera设计中,百度总结了很多实践经验,颜世光现场进行了分享。在分层设计方面,问题最好解决一次,一处解决多处受益。在可用性设计方面,硬件&软件故障不可避免,应增加容错能力,降低故障恢复时间。针对低延迟设计,他建议这个过程中,慎用自动GC的语言。

央视国际网络有限公司技术事业群DBA 古雷:MySQL5.7与8.0新特性管窥(PPT下载

央视国际网络有限公司技术事业群DBA古雷在主题演讲中详细讲解了MySQL5.7与8.0的诸多新特性,如Group replication(5.7版本)、快速增加列宽(5.7版本)、The Rewriter Query Rewrite Plugin(5.7版本)、JSON(5.7和8.0版本)、UUID更好的支持(8.0版本)。通过形象的比喻,说明了如何保证数据一致性,包括每个事务发给所有节点在每个节点;所有事务的认证顺序都是一样的,认证顺序由类似Paxos协议保证;每个节点认证的事务可能是本地发起的本地事务,也可能是别的节点发过来的外来事务等要点。

微博商业产品部算法技术专家 康乐:微博商业数据挖掘方法论(PPT下载

数据挖掘以用户为中心展开,数据体系来自基础数据、兴趣数据、情景数据和能力数据。数据抽象之后定义成情景引擎,有LBS数据、App使用数据、话题数据、微博互动、关注、用户信息、分组信息。接着康乐分享日常会忽略但是重要的挖掘方法,第一种方法是评价,其中有四个级别,首先是效果级,数据挖掘的产出可以直接用线上来评价,如兴趣标签;第二是Ground truth级,统计有效的信息来挖掘数据,如性别、年龄;Case级别,每个用户状态来验证算法结果,如旅游状态;无法验证以上事实,可以使用Logic级,其中兴趣标签占取最高级别和最低级别的评价。第二种是兴趣标签挖掘方式,指定广告场景下用户对某个粒度的广告发生目标行为的概率。第三种根据平台的内容特性来确定分类。数据挖掘的实战经验首先要做到紧贴业务,学会花时间沟通让数据和业务活起来,然后建设系列评价体系,对于数据工作要遵循数据>特征>模型的规则。

京东商城数据挖掘工程师 崔波:Spark Streaming在京东广告跟踪系统里的应用(PPT下载

京东广告跟踪系统主要目的是为了评估广告投放效果,具有分钟级延迟、所依赖用户行为日志巨量等特点,之前面临重度依赖redis+http+rpc等外部服务和技术栈+数据存储栈分化等挑战。广告系统分为四个模块:data input、persist queue、computing、storage。每批次遍历海量数据,有复杂join跟sort。Spark 2.0具有新的tungsen引擎、全阶段代码优化、Cache感知算法、更好的Parquet并行解析器等优势。在实践过程中,是一个批量处理系统,有反压与流控功能,可以根据流量反控读取速度,还有弹性扩展功能,能根据负载流量自动调整资源。但是Streaming代码逻辑并不符合直觉,有时候处理上一个批次的数据比较难,对于过度设计也未避免,导致过高的抽象度使得一些简单的操作很难,另外Spark存在潜在的bug,如jdbc的异常处理。对于以上的缺陷,可以调整一些默认的参数,不使用streaming本身的checkpoint功能,避免使用大窗口Dstream和不是用流控跟反压功能来进行设计取舍。可以引入alluxio,促使IO加速。在编程过程中,可以用到dataSet或dataFrame,崔波建议尽可能使用dataSet代替dataFrame。

Ruff架构师、JavaScript专家 周爱民:有前端思想的物联网系统架构(PPT下载

Ruff架构师、JavaScript专家周爱民发表《有前端思想的物联网系统架构》主题演讲。周爱民首先介绍了三位图灵奖的获奖人并由此引出本次的分享议题,即程序是可被组织的元素。接下来,周爱民详细解释了如何将物联网描述成网络,进而把它Run在云端。那么如何将网页Run起来?周爱民认为,其本意并非Run的问题,而是Run me的问题,也就是Run后面的me。


北京站的精彩不止于此,SDCC的脚步亦从未停歇,SDCC 2017再临上海,运维+架构+数据库三弹连发,实力巨献。早春三月,乍暖还寒,且看SDCC引爆技术圈。更多详情欢迎登陆SDCC官网,申城小叙,等你来约。

评论