| 主页  | 教研组介绍 | 教学情况 | 联系方法 | English |
 
科学研究
研究方向
研究课题
研究成果
学术信息
学术动态
学术交流
理论与技术
语音合成
语音分析
生物特征
音频检索
人员组成
在研人员
访问学者
毕业学生
发表论文
2009
2008
2007
2006

2005
2004
2003
2002
2001
2000
1999
1998
1996-1997
1995 之前
成果演示
软件下载
相关站点
相关站点
 
 

文-语转换(Text to Speech,简称TTS)是语音合成系统的延伸,就是把计算机内的文本转换成连续的语声流输出,它的主要功能是能将计算机中任意出现的文字,转换成自然流畅的语音输出。它的研究涉及到语音学、人工智能、计算机科学、语言学、心理学等,同时它的研究也推动了相关学科的进步和发展。

一般来讲,实现计算机语音输出有两种方法:一是录音/重放,二是文字—语音转换。若采用第一种方法,首先要把模拟语音信号转换成数字序列,编码后,暂存于存储设备中(录音),需要时,再经解码,重建声音信号(重放)。录音/重放可获得高质量声音,并能保留特定人的音色,但所需的存储容量随发音时间线性增长,而且不能满足实时修改发音内容的需要。

第二种方法是基于声音合成技术的一种声音产生技术。它源于语音生成机理及可计算声学模型。若采用这种方法输出语音,应预先建立语音参数数据库、确定语音生成算法等。需要输出语音时,系统按需求先合成语音基元,再按语音学或语言学对自然语言的要求,连接成自然的语流。其特点是,文语转换的参数库不必随发音时间增长而加大。

[下一页]

@2009 Research Group of Human Computer Speech Interaction.