首页学术圈知识脉络 相似性检测

四部一市”共建国家生物医药国际创新园

2007-7-11 09:04:26
来源:科技日报/付毅飞 聂翠蓉 冯国梧




在刚刚结束的“Blizzard Challenge 2007”国际英文合成大赛上获悉,科大讯飞报送的参赛系统获得了本次大赛全部3项评测指标综合排名第一名的优异成绩。这是继去年科大讯飞在这一赛事上获得全部评测指标第一名后,第二次蝉联这一佳绩。这一技术成果得到了国家863计划的支持。此次夺标,充分体现了科大讯飞不仅在中文语音和语言技术领域独占鳌头,在英文语音合成技术上也已取得了稳固的领先地位。

Blizzard Challenge国际英文合成比赛是英语语音合成领域最具权威性、广泛性的国际评测比赛。由美国卡耐基-梅隆大学(Carnegie Mellon University)和日本名古屋工业大学(Nagoya Institute of Technology)联合组织发起,旨在建立一个统一的英文语音合成技术的评测平台,加强各语音研究机构之间的交流与沟通,促进语音技术研究的深入发展。

评测采取公平、公正、公开的原则,各参赛机构在主办方提供的统一英文音库的基础上,采用自己的研究方法合成待测句子,所有合成效果随机打乱后共享在网络上,由包括语音合成专家、美国本土学生和兴趣人士三方面人员联合评分。系统的评价指标包括自然度和可懂度等方面。

作为国际上规模最大、影响力最大的英文语音合成大赛,历届Blizzard Challenge都成为国际一流的科研单位和一流企业角逐英文语音合成技术桂冠的竞技平台。本届大赛的参赛单位达到了创记录的16家,其中包括CMU (美国卡耐基-梅隆大学)、IBM 研究院、Edinburgh University(英国爱丁堡大学)、ATR(国际电气通信基础技术研究所)、Nitech(日本名古屋工业大学)等语音技术领域的世界顶尖高手。同时,在与上届比赛准备时间相同的条件下,本届大赛的语料库从上届的4000句扩展到了6000句,大大增加了参赛单位系统准备的难度。

在时间紧、对手强的竞争压力下,科大讯飞凭借扎实的积累和过硬的技术,分别报送了独创的新一代基于概率模型和单元挑选的“波型拼接系统”,以及基于概率模型和合成器的“Trainable TTS系统”。本届大赛以相似度(Sim)、自然度(Mos)、合成句听写错误率(Wer)为三大核心测试项目。经过由每个参赛单位选派的10名语音专家、英国和美国以英语为母语的大学生、以及网上志愿人员组成的评测人员的科学打分,科大讯飞参赛系统获得了全部三大评测指标综合排名第一名的好成绩。

在国家863等计划支持下,经过“十五”期间的不懈努力,科大讯飞语音合成技术取得重要突破,达到了让市场接受的地步,完全可以满足社会各行业的应用要求,一个新兴的中文语音高科技产业由此诞生。