返回 登录
0

从贝叶斯计算、深度学习、智能投顾看人工智能与区块链技术

“人工智能与区块链技术研讨会西安站”9 日在西安电子科技大学举行。这是继北京站顺利举办之后,人工智能与区块链技术研讨会全球巡回的第二站。包括西安电子科技大学通院电子实验室主任刘乃东、清华大学软件学院邓仰东、MATRIX 区块链首席架构科学家李庆华等重量级嘉宾都发表了主题分享。

在之前的北京站上,会议发起成立 “人工智能与区块链技术发展联盟”,推动“人工智能与区块链”的融合与长远发展,据联盟筹备委员负责人张国强介绍说,联盟的宗旨是推动人工智能技术与区块链技术相融合,加速区块链技术向第三代基于人工智能的阶段演进,建立华人在新技术上的标准和话语权,让人工智能和区块链技术更广泛地普惠社会大众。

下面是本次人工智能与区块链技术研讨会西安站的精彩分享回顾。

西安电子科技大学通院电子实验室主任刘乃东开场致辞

西安电子科技大学通院电子实验室主任刘乃东首先对今天来参加研讨会的嘉宾表示欢迎,他表示:近年来,本身人工智能和区块链这两种技术逐渐成为国际上炙手可热的两种技术,这两种技术都代表着未来的发展方向,越来越受到企业界、科技界,特别是投资界的亲睐,而人工智能与区块链的融合是大势所趋,必将会给 IT 界带来不可估量的好处,也有可能是更多激动人心,甚至是颠覆性的变化。

他认为,虽然今年的 9 月 4 日,央行、网信办等叫停了 ICO,但这主要是针对金融层面的,并不实代表国家对数字货币的否定,更不代表对区块链技术的否定,反而是更规范了区块链的应用,给行业会带来更高更新的发展。 随后,他代表这次通信工程学院预祝本次会议能圆满成功。希望能通过本次会议促进人工智能和区块链技术融合,推动技术和商业、模式、机制的创新。

清华大学软件学院邓仰东:贝叶斯计算和未来人工智能

深度学习在各个方向改变着我们的未来,但是,另一方面深度学习还有很多问题没有解决,之后怎么解决?清华大学软件学院邓仰东表示,将来,贝叶斯技术应该会和深度学习技术集成、融合,从而塑造未来的一种力量。

怎么构造像人一样学习思考的机器,虽然过程无比复杂,我们列出了可能的认知任务,首先是概念学习,从小到大学很多概念,概念之间可以做推广、归纳。第二是学各种范畴,第三个是小孩子虽然并不知道牛顿定律,但是可以大致知道运动的趋势,而且可以根据这个趋势进行各种各样的认知活动。第四个一边感知,一边学习过程,比如是学走路的时候,这也是一个典型的认知活动。第五个是做白日梦,比如自己穿越到什么地方,这个过程也很重要。第六个是学会理论,包括归纳总结等等。

现在事实上有三条不同的路线做这样的工作,第一是基于神经图像的工作,也就是图像技术对人脑思维活动进行扫描;第二个工作是硬件方式去造一个内脑计算机,最好的是 IBM;再有一个是用超计算机和软件方法仿真人脑,比如瑞士大学用一台超级计算及模拟分子级的神经网络行为。

他强调,现在有更多证据都表明人的认知活动基本服从贝叶斯定律,贝叶斯理论现在已经是非常成熟的领域,最典型的是贝叶斯网络,现实生活中也有很多应用,比如法航空难,怎么找到残留,因为位置不是精确确定,通过贝叶斯网络预测残骸会出现在什么地方,这红色区域是概率最大的地区,最后,果然在那个地方找到飞机的残骸。

首先我们想造一台像人一样学习思考的机器,有很多是深度学习无法解决的,贝叶斯很大程度上可以解释人的认知行为,所以,能不能造一台计算机,进行贝叶斯计算。他认为,MCMC 计算非常厉害,可以逼近任意概率分布,缺点是速度比较慢,而且是顺序算法。有一篇文章提出对 MCMC 进行变形化的方法,这个方法确实很有效,包括对电路进行设计,把复杂的 MCMC 链条通过新的算法组织成并行工作,这样整体速度会变的非常快。这个方法 GPU 可以达到几十倍加速,专用硬件可以达到几百倍的加速。

最后,他总结道,今天讨论的是人工智能已经成为改变我们生活的非常重要的力量,而深度学习虽然已经取得巨大成功,但是下一步贝叶斯计算可能是重大的突破方向。这里面他们做了一台贝叶斯计算机,还不是特别完善,贝叶斯计算机基于随即逻辑电路进行各种复杂概率计算,还有变形化的方法可以把速度做的非常快,使得区块链技术和贝叶斯计算结合起来,为区块链技术找到一个真正的有意义的突破口。

MATRIX 区块链首席架构科学家李庆华:区块链到基于共识自治的“AI 宪法”

李庆华的分享主题为《区块链到基于共识自治的“AI 宪法”》,主要从区块链是什么、人工智能为什么跟区块链结合在一起、人工智能跟区块链结合在一起是什么、人工智能和区块链合在一起应该怎么做来展开。

区块链实际上是分布式账本,是一种通过去中心化、去信任的方式集体维护一个可靠数据库的技术方案。如果大家认为区块链本质是基于网络的分布式数据库技术,李庆华给出的答案就是“是”,但是是一种几乎不可能被更改的分布式数据库。

区块链核心技术有两个,一是共识机制,怎么投票,投票权重和怎么表达意愿和获得表决权,真实含义是通过 CPU 的解算来表现出大家一致性的意愿。二是交易,在数据库交易之上进行交易,如果单纯一个数据库没有意义,数据库核心是为了进行交易。

人工智能加上区块链就可以造就下一代的价值互联网。 当前区块链与 AI 最有价值的核心点包含几个,通过 AI 代替人类做出判决,帮助投票机制的 AI 化,PoW 算力 AI 化,包括智能合约的 AI 化,利用 AI 整合各种应用服务等。区块链交易里面有很多问题,跟人类社会一样,一是交易顺序依赖,可以矿工贿赂执行者,同样需要判别合约里面是否有优先权的问题。二是时间戳依赖,生存的时间戳对现在有害处,这个矿工可以隐匿,也可以通过人工智能审查合约,单个数据很难发现跟时间戳有依赖的,必须通过大量训练找到。三是误操作异常,一旦错误,可以制造 AI 认知规则,判断应该是什么样子,完成相应的损失挽回。四是可重入攻击,这种是很具体的。

区块链愿景目标是基于 AI 分布式自治的价值互联网,第一代互联网是基于 PC 的固定网络连接的互联网,第二代基于移动终端的移动互联网。第三代互联网他认为是基于区块链基础之上的价值互联网,因为它打通线上和线下财富的接口。核心是基于共识机制、AI 宪法、公开透明、不可更改,同时脚本图灵完备,交易货币化,而且跨越区域和国界,同时区块链是理想主义原则与实践。区块链和 AI 结合,AI 某种意义上以空间整合时间,人工智能能够从历史预测未来,AI 和区块链融合之后能够实现空间与时间的紧密结合,人类是四维空间动物,区块链和人工智能结合就是空间和时间的完美结合,所以他认为利用 AI 需要通算力开放,实现造福于人类。AI 要完成线上线下交易,形成价值互联网。AI 区块链可以实现下一代价值互联网。

加速云 CEO 邬刚:FPGA 深度学习在金融行业的应用

接着李庆华之后,登台分享的嘉宾是加速云 CEO 邬刚,他的分享主要聚焦“FPGA 深度学习在金融行业的应用”。他表示决定人工智能三要素:一是海量数据,二是算法,三是计算能力。UIPG 做这个事情主要是解决计算能力的问题,决定整个算法演进靠计算能力,可以用 CPU、GPU,也可以用 FPGA,现在主要采用异构方法实现提升计算能力。

深度学习场景下面实际上有两种场景,云+端的概念,一个是在端上面,比如大家有很多智能摄像头,比如汽车,或者说工业机器人都可以在前端,有很多决策都是放在前端做,在前端要求的是强实时,但是一般是单个个体用户,计算量也很大,一个高性能,一个强实时,一个低功耗。第二种场景是数据中心,比如大家上网经常用微信,在微信上没有违法言论,后面主要是靠人工智能做违法言论的过滤,这个每天调用在 200 亿次以上,需要有巨大的数据中心支撑这样的业务,要求的是高效能、高并发,同时要求低功耗,对于深度学习两种场景下都有各自的条件,什么样的芯片,或者什么样的方案适合它有不同的选择。FPGA 的优势是借用通用处理器和 ASIC 中间的道路,假定我们一个半导体工艺做出来芯片 18 个月,其中 6 个月做 FPGA 功能验证,剩下做工艺和后端工艺。除了这个 FPGA 还有三个好处:

  • 第一是性能功耗比,虽然跟 ASIC 比没有性能功耗比,但是如果跟 CPU 和 GPU 比性能功耗比还是比较好的,是两到三倍以上的性能功耗比。
  • 第二是强实时/低延时,相当于 GPU 和 CPU 来讲,基本上有实时操作系统也是毫秒级的。
  • 第三个是 IO 可编程,可以定义成你想要的任何数字接口。

随后他例举了三个金融领域的应用。

最后他介绍了他们目前正在做的事,主要是用 FPGA 做深度学习,做大数据加速,可以在数据中心、云计算、机器视觉方面。具体做了一些硬件平台有加速卡以及加速模块,主要用于前端智能,比如汽车、无人驾驶、机器人,还有军用的等等。

西北工业大学教授谢磊:深度学习在智能语音领域的一些新进展

目前,国内很多大公司、创业公司都在做智能音响,初步统计大概有 49 家公司在做类似的智能音响,我们称之为百箱大战,很多企业看中智能音响带来的交互便利。

在谢磊博士看来,大家现在跟设备对话,背后的推动力就是深度学习,他形象的称之为“深度炼丹”,当然,为了炼丹是需要很多元素,比如:

  • 第一,药材要好。现在语音识别效果为什么越来越好,因为有大规模真实数据积累,是真实用户数据,这是非常有价值的。

  • 第二,真火,机器学习,推动很多技术发展,深度学习最早在商业上成功应用,大规模商业数据上成功应用就是语音识别,

  • 第三,炼丹炉,超级计算,不管是 GPU,还是谷歌最新突出的 TPU,必须有好的容器才可以把深度学习做好。

他谈到,目前语音识别领域也面临非常多的挑战:

  • 第一个是鲁棒性,包括口音、噪声、原场识别、信道问题;
  • 第二是多类复杂性,语音有各种各样的类别,通过麦克风讲演的语音,上课语音,电话通话语音等等,类别非常多。一个语音识别系统不能适应各种各样的不同语音类型。
  • 第三个是低数据/计算资源,中文已经有很多数据,普通话有很多数据,很多小语种没有标注数据,现在很多时候一个模式识别系统要成功,需要大量标注数据,这是非常重要的,但是标注数据是非常费人的工作,所以有时候说人工智能是真的人工智能,或者说“人工”人工职能,有多少“人工”就有多少人工智能。
  • 第四是多语言特性,比如陕西话的识别,很多大公司花很多钱装入数据才可以达到今天的效果,这是非常有挑战性的。

在谈到他们合作伙伴腾讯的俞栋对目前语音识别方面的看法,包括有效的端到端的,模型是否可以自动适应新的使用环境,前端信号采集、增强和后面的模型联合优化等。这些方向上他们实验室做了一些研究。第一,可以用深度学习做语音增强,第二,用深度学习去混响,这项技术跟小米合作,在语音识别测试级上发现有非常好的收益,没有加混响的声音错误率 9.43%,加了混响之后的错误率 32.43%,用了去混技术进行识别错误率降低到 16.37%;第三,基于深度学习的语音分离,解决鸡尾酒会的效应,第四,无监督域适应。比如在车载上适应新的环境,有效的解决这个问题,最终结果也是在两个方向上有比较好的收益。

他也表示,虽然语音合成听起来感觉简单,但是实际上是比较复杂的系统,涉及到两大的模块,一个文本分析,把输入文字转化成后面处理识别的文本表示。二是拿文本表示做影射,预测波形。前端文本分析是涉及到非常多的自然语言处理模块,比如断句、文本规一化、分词等,举一个例子分词,分词有错误的话大家对语意理解有非常大的问题。这是药店的牌匾“杭州市长春药店”,如果让机器读可能就是“杭州市长,春药店”。

语言合成的挑战:一是参数化方法的音质提升。二是快速定制,现在大家用百度地图,已经有不同的导航音,标准声模做的话需要请声优、声模到录音棚里面进行建模,实际应用里面大家用很少量的数据可以合成一个人的声音,这就是快速定制和个性化。三是表现力,让合成声音更加丰富。

最后,他介绍了他们实验室目前做一些新的工作,比如用无监督的、半监督方法,还有用射频对抗网络,把语音识别联合起来做对偶。用非常少量的数据做无监督的或者半监督的学习等等。

智能投顾方面量化投资数据科学家李悦:智能化资产配置

智能投顾在中国是 2014 年引入中国,2016 年是智能投顾发展的元年,目前是三足鼎立状况。首先是创业公司,像我们的团队,很多从海外回来,希望把思想本土化。第二个是国内传统的金融机构,比如券商,第三方理财平台,目前券商还是很多的,比如广发证券、兴业证券,他们积极和第三方创业公司和技术机构对接实现产品研发。中美市场确实有很多不同,比如说投资者的构成、可投资的品种,如果简单硬搬美国市场方法,必然会造成水土不服的现象。

他表示,现阶段把智能投顾分三类,第一是纯粹资产配置平台,给一些投资分析建议,不会直接进行交易、投资管理,收取的是顾问费,这一块主要是牌照问题。第二是传统互联网基金销售平台,比如天天基金也会帮助客户配置公募基金,也有比较成熟的基金平台系统,为客户提供了一个 FOF 的资产配置组合。第三个是自身以 P2P 平台为主,在销售 P2P 产品的时候进行资产配置。

传统投顾与智能投顾的比较。第一是资产门槛,传统投顾比较高,智能投顾没有门槛。第二是服务对象,传统投顾是高净值客户、客户群体较小,智能投顾是广大投资者,包括普通散户。第三是服务模式,传统投顾是特定的投资顾问通过与客户交流提供投资建议和指导,智能投顾是依托人工智能技术运用后台数据得出科学的投资方案。

对于智能投顾的四大模块,他表示,一是人工智能辅助下的量化交易市场预警,比如对于市场上舆情分析,不光是达到语音上的理解,同时怎么样对标资产,比如我现在目前有资产,这个新闻会怎么影响我的资产,我应该怎么行动,应该做出什么举动。二是深度学习构建基金的知识图谱。三是认知学习技术量身定制的个性化资产方案。四是做好客户风控。

那么,智能投顾瓶颈是什么,他认为再高大上的算法都离不开优质的数据,保险客户数据和客户的网络行为,都是可以全方位的刻画一个用户的风险嗜好、消费记录、信用卡消费和其他平台已经购买的理财产品,这些多维度可以说明这个客户应该去接受什么样的水平风险等级。

对于智能投顾的思考,他总结道,一是制约智能投顾公司发展的牌照问题,介绍公募基金产品的时候首先是牌照,做资产管理也有相应牌照。二是分步实现公司财富管理业务智能化。三是考虑到智能投顾的业务风险和潜在责任,比如银行推荐一个什么理财产品没有达到预期目标,可以到银行找他,至少你心里觉得相对安全一些,如果算法出现问题没有达到一开始的预期找谁呢,这也是行业中大家需要思考的。解决方法就是应当为客户办理专业责任强制保险。四是智能投顾销售公募基金,P2P 平台销售 P2P 理财产品。五是证监会不允许直接投资美股,还有资金出海的问题,海外券商的安全性怎么样得到保证。六是期权,上证 50ETF 指数期权,其他都是券商场外的 OTC 齐全,规模小、交易费高,增加交易对手的违约风险,所以达到一定收益的时候,相对应的风险也在提高。七是 P2P 网贷平台安全性。是否真的运用了资产配置模。

西安电子科技大学教授马文平:区块链安全基础及在云计算中的应用

西安电子科技大学博士马文平首先表示,区块链安全基础,基于区块链构成系统核心的安全目标是保证在所有参与者之间建立一种共同的不可逆的交易序列。

用区块链构造分布式系统。这个系统安全目标是保证在所有参与者之间建立一种共同的不逆的交易序列,有了这个目标以外,我们以后做的就要看你是否达到安全目标,达到安全目标有两个模型,一个是多方安全计算模型证明,这个模型有一个缺点,只关注一致性,并不关注系统里面其他特性,我这两年提出新的模型,区块链协议的安全需求,一致性安全协议是非常重要的特性,第二是对安全协议的分析,归结为机密性和一致性,多方安全计算模型只能证明一致性,没有办法保护隐私所以没有机密性,一致性就是所有参与者可以实现共识,基于区块链系统比如比特币光这一条不够,后来提出要加一个链质量、增长性,也就是有三个安全目标,基于这三个安全目标可以建立一个安全模型,让我们来证明基于区块链构造的系统是否安全。最后证明比特币在这个系统下这三个安全目标都是可以达到的。

有了这个模型之后对以后基于区块链构造的应用系统,是否安全必须严格证明,工作量证明机制这个做法也是基于区块链构造的一个系统研究任务。PoS 就是比特币提出的共识机制,还有一些新的共识机制是新改进的,共识机制是整个基于区块链的核心机制之一。

最后他表示,云计算和区块链相结合有两个思路,一是基于现在有关云平台构造基于区块链的服务,二是利用区块链的思想及分布式的思想构造新的云服务平台,更多是关注后面的。 因为区块链应用场景非常多,实际上就是用区块链构造应用系统,包括共识协议、激励机制、工作量证明等,但安全目标是什么,怎么样证明它达到了安全目标,这个模型建立起来这个问题就解决了,我们就是致力于这方面的研究。

评论