返回 登录
0

如何确保A.I.营养充足

阅读3794

原文How to ensure your A.I. gets good nutrition
作者:Heidi Maher 翻译:赖信涛 责编:仲培艺

图片描述

人工智能就像孩子一样,需要合适的教育来激发他们的潜能,也需要合适健康的饮食——高质量的数据。

业务的快速增长亟需人工智能加快判断能力,但是在人工智能的黑盒子里,要考虑的东西很多。人工智能所做出决策的质量和数据质量息息相关。有一句老生常谈的话——“废料只能出废品”,对人工智能来说再合适不过。

为什么呢?比较一下下面两种方式的区别就知道了。一般的分析方案会提供一个特定顺序的结果关系图表。如果你问一个分析程序,为什么北方的销售业绩变差了,你就会得到一系列可能因素的列表:供应链问题、人口变动、社会媒体倾向等。然后需要人工评估这些结果,最后确定到底是哪一个因素。而人工智能给出的答案将会更直白,如果你问人工智能这个问题,你将会得到唯一一个确定的答案。就这样,非常简单。

人工智能的方法将会实现很多商业用户的梦想:问一个问题,得到一个确定的答案,然后自信地采取下一步行动。这将会节省时间,带来更快速、更优秀的商业决策。

但如果人工智能是错误的呢?更重要的是,商业用户如何才能知道人工智能出错了?因为这个原因,依赖人工智能要比依赖分析方案付出更多的信任。对首席数据官或数据科学家来说,训练一个人工智能是莫大的责任。

用来训练人工智能的数据必须要干净、有相关性、可追溯数据来源。人工智能要保持“膳食平衡”,需要满足一下几点:

确定范围

人工智能不能喝掉一个数据湖里面所有的水,这些数据是未经清理、打包和结构化的。根据CGOC(Compliance, Governance and Oversight Counsel),公司产生的数据中,有将近70%是没有业务关系、没有价值的,所以你必须开发一种方式,来理解和确定数据的范围,和人工智能所能接受的数据标准。使用什么样的数据?什么样的类型?数据之间有什么样的联系?谁来为决定负责?

审核并管理资源

一旦确定了数据资源,你就需要确保数据的质量。为了提高人工智能的可靠性,你需要了解数据的可靠度、真实性和内容对数据集合的贡献。这些可以通过热图和可视化完成。

因为数据通常都是由多个资源复制过来的,数据科学家和项目专家必须有一系列的处理过程,包括确定数据位置、审核和跟踪。

标记和分类

你需要对数据进行标记和分类,以确保数据可以被正确地理解。由于人工智能的特殊性,元数据比其他数据更有价值。如果你在关注市场数据,那么你得到的元数据会包括社交媒体网站的图片、物理位置、时间戳、相机类型和一系列数字。在医疗方面,元数据包括病人的身份证生日、数据时间戳和必要的隐私内容。

跟踪反应和更新

最后,你必须有控制系统的能力,能跟踪使用信息并据此进行更新。

对人工智能莫大的讽刺是,这看起来是一项完全自主的计算过程,是数据自我处理的一个过程。实则需要人类在某一特定方面的知识来训练人工智能。只有认识到人类工作的重要性,才能让人工智能作出正确的决策,避免过度自信。作为“父母”,我们必须不断的、有耐心地训练人工智能,直到他们能非常优秀地满足我们的需求。

2016年8月12日-13日,由CSDN重磅打造的互联网应用架构实战峰会运维技术与实战峰会将在成都举行,目前18位讲师和议题已全部确认。两场峰会大牛讲师来自阿里、腾讯、百度、京东、小米、乐视、聚美优品、YY互娱、华为、360等知名互联网公司,一线深度的实践,共同探讨高可用/高并发/高性能系统架构设计、电商架构、分布式架构、运维工具研发与实践、运维自动化系统的构建、DevOps、云上的运维案例分析、虚拟化技术、应用性能检测与管理、游戏行业的运维实践等,将和与会嘉宾共同探讨「构建更安全、更高性能、更稳定的架构和运维体系」等领域的话题与技术。【八折优惠中,点击这里抢票,欲购从速。】

评论