| 主页  | 教研组介绍 | 教学情况 | 联系方法 | English |
 
科学研究
研究方向
研究课题
研究成果
学术信息
学术动态
学术交流
活动照片
理论与技术
语音合成
语音分析
生物特征
音频检索
人员组成
在研人员
访问学者
毕业学生
发表论文
2011
2010
2009
2008
2007
2006

2005
2004
2003
2002
2001
2000
1999
1998
1996-1997
1995 之前
成果演示
软件下载
相关站点
相关站点
 
 

文-语转换(Text to Speech,简称TTS)是语音合成系统的延伸,就是把计算机内的文本转换成连续的语声流输出,它的主要功能是能将计算机中任意出现的文字,转换成自然流畅的语音输出。它的研究涉及到语音学、人工智能、计算机科学、语言学、心理学等,同时它的研究也推动了相关学科的进步和发展。

一般来讲,实现计算机语音输出有两种方法:一是录音/重放,二是文字—语音转换。若采用第一种方法,首先要把模拟语音信号转换成数字序列,编码后,暂存于存储设备中(录音),需要时,再经解码,重建声音信号(重放)。录音/重放可获得高质量声音,并能保留特定人的音色,但所需的存储容量随发音时间线性增长,而且不能满足实时修改发音内容的需要。

第二种方法是基于声音合成技术的一种声音产生技术。它源于语音生成机理及可计算声学模型。若采用这种方法输出语音,应预先建立语音参数数据库、确定语音生成算法等。需要输出语音时,系统按需求先合成语音基元,再按语音学或语言学对自然语言的要求,连接成自然的语流。其特点是,文语转换的参数库不必随发音时间增长而加大。

[下一页]

@2009 Research Group of Human Computer Speech Interaction.