了解语音认可
想象一下,自己坐在沙发上放松,刚订购您的计算机或笔记本电脑或手机,以便键入一封信或执行少数命令。是否可以?
当然,这就是语音识别的地方。
通过定义,它是识别人类演讲的过程,并将其解码为文本形式。
原则
基本原则语音识别涉及任何人所说的言语或言语在空气中引起振动,称为声波。这些连续或模拟波被数字化和处理,然后解码为适当的单词,然后解码为适当的句子。
语音识别系统的组件
那么基本的语音识别系统是什么组成的?
- 语音捕获设备:它由麦克风组成,它将声波信号转换为电信号和模数转换器,该数字转换器采样和数字化模拟信号,以获得计算机可以理解的离散数据。
- 数字信号模块或处理器:它对频域转换等原始语音信号执行处理,仅恢复所需的信息等。
- 预处理信号存储:预处理的语音存储在内存中以执行语音识别的进一步任务。
- 参考语音模式:计算机或系统由已经存储在存储器中的预定义语音模式或模板组成,用作匹配的参考。
- 模式匹配算法:将未知的语音信号与参考语音模式进行比较,以确定实际的单词或单词模式。
系统的工作
现在让我们了解整个系统的实际工作原理。
- 语音可以被视为声波形,即信号携带消息信息。正常的人类具有他/她的铰接器(语音器官)的有限运动率(语音器官)可以以每秒10个声音的平均速度产生讲话。平均信息速率约为50-60位/秒。它意味着在语音信号中实际上只需要50位/秒的信息。通过麦克风将该声波转换为模拟电信号。模数转换器通过以离散间隔进行精确测量波来将该模拟信号转换为数字样本。
- 数字化信号由每秒16000次采样的周期性信号流组成,不适合执行实际语音识别作为模式不容易定位的过程。为了提取实际信息,将时域中的信号转换为频域中的信号。这是由数字信号处理器使用FFT技术完成的。在数字信号中,每个1/100后的组件TH.分析了第二个第二,并且计算了每个这样的组件的频谱。换句话说,数字化信号被分段为频率幅度的小部分。
- 每个段或频率图表代表人类所做的不同声音。计算机执行未知段的匹配与特定语言的存储语音。此模式匹配以3种方式完成:
使用声学语音方法:在声学语音方法中,通常使用隐马尔可夫模型。该模型开发了语音识别的非确定性概率模型。该模型由两个变量组成 - 存储在计算机存储器中的音素的隐藏状态和数字信号的可见频率段。每个音素都有自己的概率,并且根据概率和匹配的音素将匹配的段与匹配的音素一起匹配,以根据所存储的语言的语言规则形成正确的单词。
使用模式识别方法:在图案识别方法中,通过针对任何语言的特定语音模式训练系统,并且通过使用时间扭曲技术确定信号之间的距离来将未知语音模式与参考语音模式进行比较。
使用人工智能:人工智能方法是基于基础知识来源的利用,例如在基于光谱测量的基础上发表的声音知识,了解适当的有意义和句法词。
语音识别系统取决于的因素
语音识别系统取决于以下因素:
- 孤立的话:需要在连续单词之间进行暂停,因为连续的单词可以重叠使得系统难以了解单词何时开始或结束。因此,需要在连续的单词之间沉默。
- 单扬声器:尝试同时提供语音输入的许多扬声器可能导致信号和中断重叠。使用的大多数语音识别系统是扬声器依赖系统。
- 词汇规模:对于模式匹配而言,难以考虑具有大词汇的语言,而不是小词汇,因为在后者的含糊不清的话语的可能性较小。
Windows 7上的语音识别系统
我想为使用Windows 7进行语音识别系统的任何人推荐以下步骤
- 从“开始”菜单中打开“控制面板”或单击图标。
- 选择易于访问,然后单击“语音识别”。
- 接下来单击“设置麦克风”,然后从“可用选项”中选择“桌面麦克风”。
- 接下来参加讲述语音教程并遵循给定的指令。
- 之后,将计算机培训更好的选择,以便计算机存储语音信号的明确模式。这是通过单击“培训计算机以更好地了解您”选项来完成的,然后按照说明进行操作。
- 现在开始语音识别图标,并开始对计算机进行语音。您还可以将自己的单词添加到计算机字典中。
实用语音识别系统:使用HM2007
可以使用语音识别IC构建实用的语音识别系统HM2007.。HM2007是一个48引脚IC,提供语音识别功能。它有两种模式:手动模式或CPU模式。在这两种模式中,首先训练IC以识别用户对应于密钥按下的相应数字的每个单词的单词。IC将每个单词信号存储在与单词对应的存储器位置中。从IC输出的数据从LCD上显示的位置接口到微控制器。
通常我们使用手动模式进行HM2007操作。
- HM2007由一个Rdy引脚组成,该引脚是一个有效的低引脚,指示IC准备训练目的。
- 语音输入将通过连接到IC的MICIN引脚的麦克风给出。
- IC与键盘接口,用于提供与每个单词对应的数字输入。IC工作在两个功能 - 清除和培训。在键盘上按下火车键时,IC将开始其培训过程。
- 在按下“火车”功能键之前,用户按下一个数字键,并将所需的单词表示给麦克风。
- IC向ME发送高信号(内存启用)引脚,连接到SRAM的相应ME引脚。对应于按压的数量的8位数据信号通过外部总线存储在SRAM(外部RAM)中。
- 检测到语音输入后,RDY引脚处于逻辑高电平,IC达到识别状态,在那里开始识别过程。
- 通过使用DEN(数据启用)引脚的数据总线给出该过程的结果。
- 然后可以通过串联接口处理器给予微控制器,或者首先使用锁存IC 74HC573锁存8位数据。
- 微控制器与LCD接口,并被编程,使得在显示器上显示相应的单词。
需要采取的唯一预防措施是不使用同音异音(具有类似声音的单词),也可以在语音中照顾激励。
所以,这就是如何基本语音识别系统作品。欢迎任何进一步的投入添加。
图像信用
语音识别系统的组成部分通过言语和扬声器识别 - 理查德D. Peacocke和Daryl H. Graf
您好先生,我想使用Arduino认识演讲并希望在LCD中打印输出。请向我发送有关此项目的完整详细信息。
您能用源代码解释与PIC16F877A的HM2007的接口吗?
优秀的项目我们正在使用我们的日常生活它真的很棒......