返回 登录
0

GTC 2017探秘:讯飞开放平台的背后

自从去年9月14日,NVIDIA CEO黄仁勋在北京举行的GTC 2016大会上正式公布新一代高性能GPU Tesla P4,这款采用最新Pascal架构和16nm FinFET工艺制程,为当前火热的人工智能、深度学习、神经网络推演而生的芯片就被NVIDIA和许多业内人士寄与厚望,希望其能够成为大幅提升人工智能、深度学习、神经网络推演等复杂计算效率的杀手锏,但“希望很丰满,现实很骨感“, Tesla P4到底行不行,还需要事实来证明!

而在近日美国圣何塞召开的GTC 2017上,科大讯飞宣布其以语音交互为核心的人工智能开放平台——讯飞开放平台得益于Tesla P4强大的性能,讯飞语音查询回复能力得到10倍提升,则用事实证明了Tesla P4不仅行!而且很行!

科大讯飞美国分公司总裁李春燕表示,在使用了NVIDIA Tesla P4之后,”原来需要两个月时间来完成的训练,现在仅需一天即可完成“,而如此闪亮的表现,则是得益于Tesla P4全新的Pascal架构,Tesla P4拥有完整版本的GP104核心, CUDA数目为2560个,单精度浮点性能5.5TFlops,INT8(八位数据专用推理指令)计算能力 22 TOPS,搭载带宽达到192GB/s的8GB GDDR5显存,但功耗仅仅为50-70w,据NVidia产品管理总监Han Vanholder介绍,在利用卷积神经网络模型AlexNet进行训练时,单节点的Tesla P4提供了40倍于Intel E5-2690v4 CPU的效率和8倍于Arria10-115 FPGA的效率。如此悬殊的效率提升,取得上面的成绩也就不足为奇了。

图片描述

李春燕表示,事实上,科大讯飞和NVIDIA已经是四年的合作伙伴,早在2013年,科大讯飞就已经开始使用NVIDIA K10相关产品,后续也使用了NVidia的M40产品,而目前的Tesla P4主要用于讯飞开发平台的深度学习推理和语音识别线上解码引擎上,相较于以前的M40,使用了P4的线上流程的实时路数提升了2-3倍,而功耗则降低了3倍多,不但提升了计算效率,而且使得单位计算成本得到了显著降低。特别的,基于P4的强大INT 8运算能力和相关算法的优化,科大讯飞利用P4平台INT 8计算将并发路数提升了10倍,并提供了接近理论峰值的20T/s的INT 8运算能力,从而刷新了合作伙伴P4平台计算能力的记录。

在会议现场,李春燕还演示了基于讯飞开发平台的面向消费者端的产品晓译翻译机,借助于深度神经网络算法以及麦克风阵列、语音识别、机器翻译、语音合成等技术方面的创新和突破以及Tesla P4平台驱动下的语音云服务的强力支持,晓译翻译机在实时语音翻译方面体现出来的能力,令现场的媒体记者和NVidia的员工们都惊叹不已。

图片描述

据悉,目前科大讯飞已占有中文语音技术市场70%以上的市场份额。截止2017年4月,科大讯飞开发平台已经拥有超过10亿用户,30万家合作伙伴,在线日服务量已超35亿人次,滴滴出行、高德地图、携程旅行、叮咚音响、海康威视、美的、优必选等各行业的知名企业已经成为科大讯飞忠实的用户。

评论