返回 登录
0

CRUX OCR:腾讯云分析永久开放免费OCR服务

阅读5724

腾讯大数据旗下腾讯云分析(MTA)近日正式对外免费开放OCR文字识别服务。这项名为CRUX OCR的新业务将提供多个应用场景下的精准OCR模块,免费为相关需求的开发者提供便捷、稳定且安全的技术服务,当前识别速度快至0.1秒,准确率高达99.6%。

CRUX研发团队隶属于腾讯大数据,专注于计算机视觉、模式识别、机器学习等领域的技术研发和业务落地。CRUX的名字灵感来源于Computation、Recognition、Understanding和Exploration,寓意计算、识别、理解和探索,同时CRUX也是88个星座中的南十字星,与团队地处南国深圳相契合。团队核心成员主要来自于中科院、北大以及东京大学、香港城市大学等国内外知名高校,皆具有较深厚的学术研究背景以及扎实的工程能力。同时积极与国内高校进行密切的科研合作,不断提升自身的科研水平。CRUX OCR是团队经过一年多精心打磨而推出的字符识别全方位解决方案,目前已经支持通用文档识别、身份证识别、银行卡识别,后续将逐步拓展至更多相关领域的应用。

CRUX OCR应用

  1. 通用文档识别
    采用高效的图像预处理方法, 融入精准的文本行检测技术,有效提取文字特征,支持常见的文档图片, 可以应用于医疗病例识别、网络图片文字识别、金融票据等多种识别场景。

  2. 身份证识别
    快速准确定位身份证,识别出关键信息,可以广泛应用于金融、政务方面的身份证自动识别场景。

  3. 银行卡识别
    快速准确定位银行卡,以及卡号位置,精准识别卡片编码,可以广泛应用于互联网金融的银行卡号自动识别等场景。

CRUX OCR技术

CRUX OCR技术在传统的图像处理方法上融入精准文字检测技术,提取更鲁棒的字符特征用于识别,同时开发了中英文混合的语言模型用于OCR识别结果的后期校正。对一些较为特殊的应用场景如银行卡,在字符信息与背景难以区隔的情况下,创造性的提出一种类似树搜索方法来实现银行卡卡号的准确识别。目前我们也把深度学习融入到CURX OCR技术框架中,也在一些场景应用(如手写体识别,自然场景文字识别)里进行尝试并取得了较好的成果。

当前我们CRUX OCR技术主要部署在两端,一个是云端服务,一个是手机终端;云端能提供海量图片的OCR识别能力,手机终端能为用户群体提供个性化的定制应用,包括前端目标定位以及OCR离线识别等全流程实现;用户也可以基于我们的核心技术进行相应的后续技术开发和产品包装。

CRUX OCR技术具有识别高准确率,高稳定性,灵活,且便于二次开发等优点。

  1. 高准确率: 通过多种先进技术手段的应用,目前识别准确率处于业界先进水平, 基元字符识别准确率>99.6%, 银行卡单次识别准确率>85%, 身份证单次识别准确率>90%。
  2. 高稳定性:基于强大的后台开发能力,目前整个在线服务系统始终保持着极低的出错率。
  3. 灵活:我们为客户提供了全方位的技术支持,同时客户也可以根据自己的需求定制符合自己的OCR技术服务。
  4. 便于二次开发:在必须的时候,客户可以基于我们的技术通过二次开发来实现自己的需求和服务。

CRUX OCR案例

目前CRUX OCR技术已经在合作伙伴中得到了有效的应用,提供技术支持。

  1. 病例识别(互联网医疗,合作客户:杭州卓健科技公司):客户通过CRUX OCR技术对病历进行扫描,挖掘病历中的文本信息,生成电子病历,加强了医疗服务的网络化和信息化管理,同时提高了医疗服务质量。

  2. 新闻图片的文字识别 (合作客户: 腾讯OMG 新闻资讯部新闻产品中心) :通过OCR技术的引进,帮助实现对海量新闻图片数据的挖掘和甄别,加强内容管理能力,提高新闻质量。

  3. 趣图识别 (合作客户: 腾讯SNG 社交网络运营部数据中心商业智能组):利用OCR技术识别用户上传的GIF格式动图,对图中文字进行挖掘,帮助客户对海量用户进行分析挖掘,提高服务水平。
       

CRUX OCR未来

持续优化OCR技术,推动OCR技术的应用,是CRUX团队一直专注的两个方面。未来的几个主要方向包括:

  • CRUX不只专注于通用文档识别,会在自然场景,广告图片文字等方面来扩展OCR技术应用的维度;

  • CRUX不只专注于身份证、银行卡,后续会设涉及如:驾驶证、护照、户口本,港澳通行证等十多种国内外证件的识别;

  • CRUX会把OCR与更多的技术融合(视频分析、自然语言处理、自动翻译等)。

相信随着互联网发展,OCR应用将结合更多的领域,拥有更多创新的应用。

评论