语音合成技术的原理
清华大学计算机系智能技术与系统国家重点实验室
吴志勇 蔡莲红
---- 当 前, 语 音 合 成 的 研 究 已 经 进 入 文 字 - 语 音 转 换(TTS) 阶 段, 其 功 能 模 块 可 分 为 文 本 分 析、 韵 律 建 模 和 语 音 合 成 三 大 模 块。 其 中, 语 音 合 成 是TTS 系 统 中 最 基 本、 最 重 要 的 模 块。 概 括 起 来 说, 语 音 合 成 的 主 要 功 能 是: 根 据 韵 律 建 模 的 结 果, 从 原 始 语 音 库 中 取 出 相 应 的 语 音 基 元, 利 用 特 定 的 语 音 合 成 技 术 对 语 音 基 元 进 行 韵 律 特 性 的 调 整 和 修 改, 最 终 合 成 出 符 合 要 求 的 语 音。
----语 音 合 成 技 术 经 历 了 一 个 逐 步 发 展 的 过 程, 从 参 数 合 成 到 拼 接 合 成, 再 到 两 者 的 逐 步 结 合, 其 不 断 发 展 的 动 力 是 人 们 认 知 水 平 和 需 求 的 提 高。 目 前, 常 用 的 语 音 合 成 技 术 主 要 有: 共 振 峰 合 成、LPC 合 成、PSOLA 拼 接 合 成 和LMA 声 道 模 型 技 术。 它 们 各 有 优 缺 点, 人 们 在 应 用 过 程 中 往 往 将 多 种 技 术 有 机 地 结 合 在 一 起, 或 将 一 种 技 术 的 优 点 运 用 到 另 一 种 技 术 上, 以 克 服 另 一 种 技 术 的 不 足。
共 振 峰 合 成
----语 音 合 成 的 理 论 基 础 是 语 音 生 成 的 数 学 模 型。 该 模 型 语 音 生 成 过 程 是 在 激 励 信 号 的 激 励 下, 声 波 经 谐 振 腔( 声 道), 由 嘴 或 鼻 辐 射 声 波。 因 此, 声 道 参 数、 声 道 谐 振 特 性 一 直 是 研 究 的 重 点。 在 图1 所 示 的 某 一 语 音 的 频 率 响 应 图 中, 标 有Fp1、Fp2、Fp3 … … 处 为 频 率 响 应 的 极 点, 此 时, 声 道 的 传 输 频 率 响 应 有 极 大 值。 习 惯 上, 把 声 道 传 输 频 率 响 应 上 的 极 点 称 之 为 共 振 峰, 而 语 音 的 共 振 峰 频 率( 极 点 频 率) 的 分 布 特 性 决 定 着 该 语 音 的 音 色。----音 色 各 异 的 语 音 具 有 不 同 的 共 振 峰 模 式, 因 此, 以 每 个 共 振 峰 频 率 及 其 带 宽 作 为 参 数, 可 以 构 成 共 振 峰 滤 波 器。 再 用 若 干 个 这 种 滤 波 器 的 组 合 来 模 拟 声 道 的 传 输 特 性( 频 率 响 应), 对 激 励 源 发 出 的 信 号 进 行 调 制, 再 经 过 辐 射 模 型 就 可 以 得 到 合 成 语 音。 这 就 是 共 振 峰 合 成 技 术 的 基 本 原 理。 基 于 共 振 峰 的 理 论 有 以 下 三 种 实 用 模 型。
----级 联 型 共 振 峰 模 型 在 该 模 型 中, 声 道 被 认 为 是 一 组 串 联 的 二 阶 谐 振 器。 该 模 型 主 要 用 于 绝 大 部 分 元 音 的 合 成。
----并 联 型 共 振 峰 模 型 许 多 研 究 者 认 为, 对 于 鼻 化 元 音 等 非 一 般 元 音 以 及 大 部 分 辅 音, 上 述 级 联 型 模 型 不 能 很 好 地 加 以 描 述 和 模 拟, 因 此, 构 筑 和 产 生 了 并 联 型 共 振 峰 模 型。
----混 合 型 共 振 峰 模 型 在 级 联 型 共 振 峰 合 成 模 型 中, 共 振 峰 滤 波 器 首 尾 相 接; 而 在 并 联 型 模 型 中, 输 入 信 号 先 分 别 通 过 幅 度 调 节 再 加 到 每 一 个 共 振 峰 滤 波 器 上, 然 后 将 各 路 的 输 出 叠 加 起 来。 将 两 者 比 较, 对 于 合 成 声 源 位 于 声 道 末 端 的 语 音( 大 多 数 的 元 音), 级 联 型 合 乎 语 音 产 生 的 声 学 理 论, 并 且 无 需 为 每 一 个 滤 波 器 分 设 幅 度 调 节; 而 对 于 合 成 声 源 位 于 声 道 中 间 的 语 音( 大 多 数 清 擦 音 和 塞 音), 并 联 型 则 比 较 合 适, 但 是 其 幅 度 调 节 很 复 杂。

免费电话
捷飞公告: 捷飞全动态建站,每个细节都能自行修改!特别提示:捷飞3G建站,手机上的有力宣传工具,1000元超低价起!
评论表单加载中...
