2.5音频编辑软件&2.6语音识别技术
2.5 音频编辑软件
windows中用于录制声音的软件,通常包括编辑、特殊音效、转换功能
(录音机、录音大师、wave studio audition)
2.5.1 Audition概述
1.发展简史
前期产品:Cool Edit Pro 1.0/1.2/2.0/2.1、Cool Edit 2000(主流产品使用广泛)
2003年:Adibe收购Cool Edit全部产品Cool Edit Pro 2.1-->Audition 1.0
然后相继推出Audition 2.0/3.0/CS5.5/CS6.0
还有带有云计算的Audition CC/CC2014/CC2015
2.Audition的功能
基本功能:集声音录制、音频混合、编辑于一身的音频编辑软件
主要功能:录音、混合、音频编辑;效果处理、降噪;音频压缩与解压缩;刻录音CD
3.窗口组成
窗口元素:标题栏 菜单栏工具栏 编辑器 功能面板(文件、媒体浏览器、效果、标记、属性、电平、选区/视图) 状态栏
2.5.2 音频操作的基础
1.如何新建、打开、保存和关闭文件
2.声音与波形的简单控制
Audition支持格式:
音频格式:mp3 wav wma
动画格式:swf flv
1、音频文件的管理
@打开音频文件
#文件--打开
#追加打开方法:到新文件与到当前文件
@导入音频文件
Audition提供文件面板,编辑前先将文件导入到文件面板中
文件--导入/文件
@创建音频文件
文件--新建/音频文件(设置采样率、声道、位深度)
@创建多轨合成项目
文件--新建/多轨合成项目
插入音频文件到多轨合成项目的方法:在要插入的声轨上右击-->插入/文件
@从CD中提取音频
CD光盘放入光驱,文件--从CD中提取音频
@保存音频文件
五种保存方式
2、控制声音的播放
控制声音的播放主要靠走带面板完成的
3、波形的缩放与滚动
波形的缩放
波形的滚动
水平方向上放大,上方的水平拖动条,拖动光标
4、录音技术
@单轨界面下录制声音
#将话筒与声卡相连接,设置录音选项来源
#启动Audition软件,单击波形编辑按钮
#弹出新建音频文件对话框-->采样率(44100)、声道数(2)、位深度(16)
#单击录制按钮
电平:声音到达红色出现爆音,声音太低清晰度不够
@多轨界面下录制声音 (半声音乐+自己音乐)
#启动Audition软件,单击多轨合成按钮
#新建多轨项目-->采样率、声道数、位深度
#单击某音轨的R按钮-->准备录音状态
#单击走带面板中的录音按钮
2.5.3 音频的剪辑技术
1、选取波形
@用鼠标直接选取
@选择一个声道的波形:
偏上方 L-左声道
偏下方 R-右声道
@选择全部波形:
编辑-选择/全选
CTRL+A
双击
@选择单个声道波形
向上的箭头 左声道
向下的箭头 右声道
2、复制波形
@选择-复制
ctrl+c
@编辑-复制为新文件
shift+alt+c
3、剪切波形(选取区域的波形剪切到剪切板中)
@编辑-剪切
ctrl+x
4、粘贴波形
@编辑-粘贴
ctrl+v
@编辑-粘贴为新文件
ctrl+alt+v
@编辑-混合式粘贴
ctrl+shift+v
5、删除波形
@选取要删除的波形
delete
编辑-删除
6、裁剪波形
是将选取区域的波形保留,其他未选取区域的波形删除
ctrl+t
编辑-裁剪
复制喜欢的波形就可以制作自定义的手机铃声
2.5.4 音频的效果器技术
1、改变波形的振幅/调整音量的大小
如果音量太大或者太小,可以用波形这幅效果器,调节音量大小,使音量适中
操作方法:
#效果-振幅与压限/增幅
#弹出效果-增幅对话框(调整滑块改变声音的大小 右大左小)
2、淡入淡出
淡入效果:指音频选区的起始音量很小,而最终音量很大
淡出效果:指音频选区的起始音量较大,而最终音量很小或者无声
操作方法:
#选择开头或结尾一段音频区域
#效果-振幅与压限/淡化包络
#弹出鲜果-淡化包络对话框
3、降低噪音/消除环境噪音
环境噪音:语音停顿处有一种振幅变化不大的声音,它贯穿于整个录制的声音
消除环境噪音的方法:语音停顿处选一段环境噪音(选择的部分最好大于1秒),Audition记录噪音的特征,然后自动消除所有的环境噪音
效果--降噪/修复--降噪--采集降声样本按钮出现声音噪声图样--选择整个文件按钮--应用
4、延迟与回声音效
延迟:是原始信号的复制,以毫秒间隔在现
回声:与原始音频的间隔长,可以分辨出原始信号与回声信号
延迟与回声效果的分类:
@模拟延迟
模拟延迟效果器可模拟老式的硬件延迟效果器的声音,适用于特性失真和调整立体声要创建离散回声,延迟为35ms或更多
添加模拟延迟效果的方法:
#效果--延迟与回声/模拟延迟
#弹出模拟延迟对话框
模式:磁带与电子管反应了老式延迟效果的声音特征
模拟器反应了后期的电子延迟线
回馈:20%的回馈将1/5原始声音的音量发送到延迟音频生成短暂的回声
200%回馈将两倍的原始声音的音量发送到延迟音频,生成快速增大到回声
@延迟效果
用于创建简单的回声和一些其他的效果
1-14ms 在空间中定位一个单声道声音
15-34ms 创建简单的合唱或镶边效果
35ms以上 用来创建离散的回声
添加延迟效果的方法:
#效果--延迟与回声/延迟
#弹出延迟对话框
@回声效果
回声效果器可以添加一系列重复的、衰减的回声到声音中
通过不同的延迟量,可以创建大到一个大峡谷,小到金属管中的声音
添加回声效果的方法:
#效果--延迟与回声/回声
#弹出回声对话框
营造空间感与增强现场感
2.5.5 声音美学
1、主要解决的问题
@如何提高声音的质量(纯净、逼真)
@如何润色声音(悦耳动听)
@如何加工声音
2、影响声音美感的因素
本底燥音:录制过程中产生的噪音
介质附加噪音:声音在放大保存的过程中产生的噪音
与音色相关的因素有:混响声音、生源特质、采样频率与采样位数等等
3、美化声音的目的:
使声音清晰、悦耳‘动听
最低22050Hz 8位
2.6 语音识别技术
概念:利用计算机自动识别语音的技术
@将语音转换成其对应的文字
@利用人的语音信息辨别说话人的身份
2.6.1 语音识别技术的发展历史
@1952年,Bell实验室研制出可识别10个英文数字的语音识别器---Audry系统
@1988年,卡内基.梅隆大学研制出SPHINX识别系统(非特定人、大词汇量、连续语音)
2.6.2 语音识别的基本原理
语音识别本质上是一种模式识别的过程
功能模块:
语音信号预处理
特征提取
特征建模(建立参考模型库)
相似性度量(模式匹配)
后处理
语音识别的基本原理:
2.6.3 语音识别系统的分类
1、根据词汇量的大小
小词汇量:<100词
中词汇量:100-1000词
大词汇量:1000词以上
2、根据对说话人的依赖程度
特定人:针对某个用户进行识别工作
非特定人:针对任何人进行识别工作
2.6.4 语音识别软件
包括:中文听写、语音命令、语音合成