语音信号识别

模式识别

<微计算机信息》(测控自动化)2009年第25卷第良1期

文章编号:1008-0570(2009)09一l-0176_m3

基于MATLAB和BP网络的语音识别系统

Thespeechrecognitionsystembased

on

MATLABandBPneuralnetworks

(华南理工大学)詹新明杨灿

ZHANXin-ming

YANG

Can

摘要:神经网络是近年来信息科学、脑科学、神经心理学等诸多学科共同关注和研究的热点。由于其具有良好的抽象分类特性,现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具。文章在讲述语音识别过程的基础上重点讨论利用BP神经网络对语音进行识别,用MATLAB完成对神经网络的训练和测试,并获得满意的结果。关键词:MATLAB;BP神经网络:语音识别中图分类号:TN912.34文献标识码:A

Abstract:Inrecent

years

neuralnetwork

is

studyhotspotof

commonattention

on

subject

ofinformationscience,brainscience,neu—

ralpsychologyandSO

on.Becauseneural

networkhas

good

abstractclassificationcharacteristic.nowithasbeen

used

in

the

re.

searchanddevelopmentof

speech

recognition

system,andbecomesthevalid

tool

whichresolves

relatedproblem

gradually

in

speechrecognition.Thispaperbrieflyintroduces

processof

speech

recognitionandemphaticallydiscusseshow

to

recognizespeech

withBPNeuralNetworks.trains

and

teststheneuralnetworkin

use

ofMATLAB.andacquires

satisfiedresult.

Key

words:MATLAB;BPneuralnetworks;Speechrecognition

1引言

出输出结果。由图2可见各层次的神经元之间形成全互连连接.各层次内的神经元之间没有连接。这种结构使多层前馈网络可人工神经网络(ArtificialNeura[Network)是一种模拟人脑神在输入和输出间建立合适的线性或非线性关系.又不致使网络经元细胞的网络结构和功能.运用大量的处理部件,由人工方输出限制在一1和1之间。图l是一个三层的BP网络结构。

式建立起来的自适应非线性动态系统。由于它模拟了人类神经输入层

隐含层

输出层

元活动的原理,具有自学习、联想、对比、分类、推理和概括能力,误筹反向传播

因此被应用于信息处理和语音识别等领域。数字化的语音信号可作为一维或二维f双声道立体声数据)矩阵来处理。而MATLAB的最大特点和优势就是矩阵运算的能力很强,因此很自然地将MATLAB应用到语音处理领域。基于这种前提和背景.将MATLAB和BP神经网络相结合进行语音识别的研究,已成为语音识别研究领域的又一个热点。本文主要介绍将语音信号经信息前向传播

过识别系统预处理后进行特征提取.再利用BP神经网络进行图lBP网络结构

训练和测试.最后得出识别结果.并给出了基于MATLAB环境下

2.2反向传播算法。

的图形用户界面GUI的实现。

算法分为两个阶段:

第一阶段(正向过程)输入信息,从输入层经隐层逐层计算各2

BP神经网络基本原理

单元的输出值:根据下式计算每层的输出值:

基于误差反向传播(BackPr01)agation)算法的多层前馈网络

netj2乞咿,

r11

fMuhiple—laverfeedforward

network),简记为BP网络,又称误差

D,=I(netf)

(2)

信号反馈网络,是神经网络的一个分支,也是目前神经网络中应第二阶段(反向传播过程)输出误差,逐层向前算出隐层各个用最多也是最成功的网络之一。它是一种有教师的学习网络,能单元的误差,并用此误差修正前层的值。在BP算法中常采用梯够实现从N维到M维的非线性映射。一般采用梯度下降法实现度法修正权值.为此要求输出函数可微,通常采用Sigmoid函数快速收敛。而构造一个BP网络需要确定其处理单元,即神经元作为输出函数。

的特性和网络的拓扑结构。

‘1’计算误差:

2.1

BP网络的拓扑结构

E=}莩(y,一只)2

(3)

神经网络的拓扑结构是指神经元之间的互连结构。BP神f21按照梯度方向计算各层权重的修正量:

经网络采用的是并行网格结构,包括输入层、隐含层和输出层,△嘞(,)2券2--砸p,

(4)经作用函数后,再把隐节点的输出信号传递到输出节点,最后给其中6,的计算公式为:’

I一(y—O,)o/(1一O,)输出层的计算方法

詹新明:硕士研究生

6,210,(1一o,)∑wit。

非输出层的计算方法

V’

一176—360元/年邮局订阅号:82—946

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐