实现手写字体识别（90%的识别率）

手写字体识别人工智能图像处理python云处理

Chpchen0304

11941人浏览 · 2020-04-13 20:53:23

Chpchen0304 · 2020-04-13 20:53:23 发布

步骤流程

1、环境配置
- 获取百度SDK
2、具体实现步骤

1、环境配置

程序整体是由python实现的，环境所包含的第三方库有requests、json、base64、pyinstaller。没有这些库的同学可以win+R输入cmd进入命令行终端pip install 库名。

获取百度SDK

浏览器搜索百度云，如未注册请先注册，然后登录点击管理控制台。点击左侧产品服务→人工智能→文字识别。点击创建应用，输入应用名称如“Baidu_OCR”，选择用途如“学习办公”，最后进行简单应用描述，即可点击“立即创建”。会出现应用列表，包括AppID、API Key、Secret Key等信息，这些稍后会用到。在这里插入图片描述

2、具体实现步骤

①获取access_token

这里我们用requests获取并返回access_token.方法如下：

grant_type：必须参数，固定为client_credentials；
client_id：必须参数，应用的API Key；
client_secret：必须参数，应用的Secret Key；

	def get_access():
	
	    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【官网获取的AK】&client_secret=【官网获取的SK】'
	    response = requests.get(host)
	    if response:
	        #dict = json.loads()
	        dict = response.json();
	        #print(dict['access_token'])
	        return dict['access_token']

②手写字体识别

下面我们定义了一个函数，参数为所要识别图片的绝对目录。注意：图片方向必须是正向，否则识别不出来。

	def write_font(filename):
	    '''
	    手写文字识别
	    '''
	    request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting"
	    f = open(filename, 'rb')
	    img = base64.b64encode(f.read())
	
	    print('正在识别...')
	    params = {"image":img}
	    access_token = get_access()
	    request_url = request_url + "?access_token=" + access_token
	    headers = {'content-type': 'application/x-www-form-urlencoded'}
	    response = requests.post(request_url, data=params, headers=headers)
	    if response:
	        text = response.json()
	        content = text['words_result']
	        for item in content:
	            
	            print(item['words'])

③成果展示

这是手写体（字体马马虎虎）
在这里插入图片描述
识别效果：

最后附上源码：

import requests 
import json
import base64
# client_id 为官网获取的AK， client_secret 为官网获取的SK

def get_access():

    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【官网获取的AK】&client_secret=【官网获取的SK】'
    response = requests.get(host)
    if response:
        #dict = json.loads()
        dict = response.json();
        #print(dict['access_token'])
        #返回access_token
        return dict['access_token']

def write_font(filename):
    '''
    手写文字识别
    '''
    request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting"
    f = open(filename, 'rb')
    img = base64.b64encode(f.read())

    print('正在识别...')
    params = {"image":img}
	#调用get_access函数，获取tokne
    access_token = get_access()
    request_url = request_url + "?access_token=" + access_token
    headers = {'content-type': 'application/x-www-form-urlencoded'}
    response = requests.post(request_url, data=params, headers=headers)
    if response:
        text = response.json()
        content = text['words_result']
        for item in content:
            print(item['words'])
    

if __name__ == '__main__':
    
    while True:
        filename= input('请输入您的图片位置(按Q退出)：')
        if(filename == 'q' or filename == 'Q'):
            break
        write_font(filename)
        print('识别完成！！！')
        print('按Q退出！')

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生