2.5音频编辑软件&2.6语音识别技术

2.5 音频编辑软件

windows中用于录制声音的软件,通常包括编辑、特殊音效、转换功能

 (录音机、录音大师、wave studio audition

2.5.1 Audition概述

1.发展简史

 前期产品:Cool Edit Pro 1.0/1.2/2.0/2.1Cool Edit 2000(主流产品使用广泛)

 2003年:Adibe收购Cool Edit全部产品Cool Edit Pro 2.1-->Audition 1.0

 然后相继推出Audition 2.0/3.0/CS5.5/CS6.0

 还有带有云计算的Audition CC/CC2014/CC2015

2.Audition的功能

 基本功能:集声音录制、音频混合、编辑于一身的音频编辑软件

 主要功能:录音、混合、音频编辑;效果处理、降噪;音频压缩与解压缩;刻录音CD

3.窗口组成

 窗口元素:标题栏 菜单栏工具栏 编辑器 功能面板(文件、媒体浏览器、效果、标记、属性、电平、选区/视图) 状态栏

2.5.2 音频操作的基础

1.如何新建、打开、保存和关闭文件

2.声音与波形的简单控制

Audition支持格式:

音频格式:mp3 wav wma

动画格式:swf flv

1、音频文件的管理

@打开音频文件

 #文件--打开

 #追加打开方法:到新文件与到当前文件

@导入音频文件

 Audition提供文件面板,编辑前先将文件导入到文件面板中

 文件--导入/文件

@创建音频文件

 文件--新建/音频文件(设置采样率、声道、位深度)

@创建多轨合成项目

 文件--新建/多轨合成项目

 插入音频文件到多轨合成项目的方法:在要插入的声轨上右击-->插入/文件

@CD中提取音频

 CD光盘放入光驱,文件--CD中提取音频

@保存音频文件

 五种保存方式

2、控制声音的播放

控制声音的播放主要靠走带面板完成的

 2.5音频编辑软件&2.6语音识别技术

3、波形的缩放与滚动

波形的缩放

 2.5音频编辑软件&2.6语音识别技术

波形的滚动

 水平方向上放大,上方的水平拖动条,拖动光标

4、录音技术

@单轨界面下录制声音

 #将话筒与声卡相连接,设置录音选项来源

 #启动Audition软件,单击波形编辑按钮

 #弹出新建音频文件对话框-->采样率(44100)、声道数(2)、位深度(16

 #单击录制按钮

  电平:声音到达红色出现爆音,声音太低清晰度不够  

@多轨界面下录制声音  (半声音乐+自己音乐)  

 #启动Audition软件,单击多轨合成按钮

 #新建多轨项目-->采样率、声道数、位深度

 #单击某音轨的R按钮-->准备录音状态

 #单击走带面板中的录音按钮  

2.5.3 音频的剪辑技术

1、选取波形

 @用鼠标直接选取

 @选择一个声道的波形:

  偏上方 L-左声道

  偏下方 R-右声道

 @选择全部波形:

  编辑-选择/全选

  CTRL+A

  双击

 @选择单个声道波形

  向上的箭头 左声道

  向下的箭头 右声道

2、复制波形

 @选择-复制

  ctrl+c

 @编辑-复制为新文件

  shift+alt+c

3、剪切波形(选取区域的波形剪切到剪切板中)

 @编辑-剪切

  ctrl+x

4、粘贴波形

 @编辑-粘贴

  ctrl+v

 @编辑-粘贴为新文件

  ctrl+alt+v

 @编辑-混合式粘贴

  ctrl+shift+v

5、删除波形

 @选取要删除的波形

  delete

  编辑-删除

6、裁剪波形

 是将选取区域的波形保留,其他未选取区域的波形删除

  ctrl+t

  编辑-裁剪

复制喜欢的波形就可以制作自定义的手机铃声

2.5.4 音频的效果器技术

1、改变波形的振幅/调整音量的大小

 如果音量太大或者太小,可以用波形这幅效果器,调节音量大小,使音量适中

 操作方法:

  #效果-振幅与压限/增幅

  #弹出效果-增幅对话框(调整滑块改变声音的大小 右大左小)

2、淡入淡出

淡入效果:指音频选区的起始音量很小,而最终音量很大

淡出效果:指音频选区的起始音量较大,而最终音量很小或者无声

操作方法:

#选择开头或结尾一段音频区域

#效果-振幅与压限/淡化包络

#弹出鲜果-淡化包络对话框

3、降低噪音/消除环境噪音

环境噪音:语音停顿处有一种振幅变化不大的声音,它贯穿于整个录制的声音

消除环境噪音的方法:语音停顿处选一段环境噪音(选择的部分最好大于1秒),Audition记录噪音的特征,然后自动消除所有的环境噪音

 效果--降噪/修复--降噪--采集降声样本按钮出现声音噪声图样--选择整个文件按钮--应用

4、延迟与回声音效

延迟:是原始信号的复制,以毫秒间隔在现

回声:与原始音频的间隔长,可以分辨出原始信号与回声信号

延迟与回声效果的分类:

 @模拟延迟

 模拟延迟效果器可模拟老式的硬件延迟效果器的声音,适用于特性失真和调整立体声要创建离散回声,延迟为35ms或更多

 添加模拟延迟效果的方法:

  #效果--延迟与回声/模拟延迟

  #弹出模拟延迟对话框

 2.5音频编辑软件&2.6语音识别技术

模式:磁带与电子管反应了老式延迟效果的声音特征

      模拟器反应了后期的电子延迟线

回馈:20%的回馈将1/5原始声音的音量发送到延迟音频生成短暂的回声

      200%回馈将两倍的原始声音的音量发送到延迟音频,生成快速增大到回声

 @延迟效果

用于创建简单的回声和一些其他的效果

1-14ms 在空间中定位一个单声道声音

15-34ms 创建简单的合唱或镶边效果

35ms以上 用来创建离散的回声

添加延迟效果的方法:

 #效果--延迟与回声/延迟

 #弹出延迟对话框

 @回声效果

回声效果器可以添加一系列重复的、衰减的回声到声音中

通过不同的延迟量,可以创建大到一个大峡谷,小到金属管中的声音

添加回声效果的方法:

 #效果--延迟与回声/回声

 #弹出回声对话框

营造空间感与增强现场感

2.5.5 声音美学

1、主要解决的问题

 @如何提高声音的质量(纯净、逼真)

 @如何润色声音(悦耳动听)

 @如何加工声音

2、影响声音美感的因素

 2.5音频编辑软件&2.6语音识别技术

本底燥音:录制过程中产生的噪音

介质附加噪音:声音在放大保存的过程中产生的噪音

与音色相关的因素有:混响声音、生源特质、采样频率与采样位数等等

3、美化声音的目的:

 使声音清晰、悦耳‘动听

 2.5音频编辑软件&2.6语音识别技术

最低22050Hz 8

2.6 语音识别技术

概念:利用计算机自动识别语音的技术

@将语音转换成其对应的文字

@利用人的语音信息辨别说话人的身份

2.6.1 语音识别技术的发展历史

@1952年,Bell实验室研制出可识别10个英文数字的语音识别器---Audry系统

@1988年,卡内基.梅隆大学研制出SPHINX识别系统(非特定人、大词汇量、连续语音)

2.6.2 语音识别的基本原理

语音识别本质上是一种模式识别的过程

功能模块:

 语音信号预处理

 特征提取

 特征建模(建立参考模型库)

 相似性度量(模式匹配)

 后处理

语音识别的基本原理:

 2.5音频编辑软件&2.6语音识别技术

2.6.3 语音识别系统的分类

1、根据词汇量的大小

小词汇量:<100

中词汇量:100-1000

大词汇量:1000词以上

2、根据对说话人的依赖程度

特定人:针对某个用户进行识别工作

非特定人:针对任何人进行识别工作

 2.5音频编辑软件&2.6语音识别技术

2.6.4 语音识别软件

包括:中文听写、语音命令、语音合成

 2.5音频编辑软件&2.6语音识别技术