Skip to main content Skip to first level navigation
Breadcrumbs

Share

Main content

テレビ会議・Web会議システムを支える音声技術

キーボードの打鍵音などのノイズ音を低減する衝撃性ノイズ低減技術、および高性能エコーキャンセラーにより、テレビ会議・Web会議システムRICOH Unified Communication System (以下、RICOH UCS)の音声品質を大幅に向上しました。

衝撃性ノイズ低減技術

衝撃性ノイズ(非定常ノイズ)とは、例えばキーボードの打鍵音、ボールペンのノック音、ボタンの押下音など、突発的に発生するノイズのことをさします。テレビ会議やWeb会議システムにおいて、この衝撃性ノイズは、会話が一瞬聞こえなくなるなど、コミュニケーションの妨げとなります。

衝撃性ノイズ低減技術は、この衝撃性ノイズの振幅スペクトルを推定して除去する技術です。RICOH UCSを介した音声からは衝撃性ノイズが大幅に低減されるため、ネットワーク越しの相手には、衝撃性ノイズが減衰された音声が聞こえます。

具体的な処理としては、まず、衝撃性ノイズの動的特徴(スペクトルの立ち上がりと減衰)を考慮して、ノイズスペクトルを推定します。この推定は、衝撃性ノイズの一般的な性質に基づいて行われるため、ノイズの種類や発生タイミングに依存することなく、またノイズが他の音声と重なっていても、スペクトルを高い精度で推定することができます。こうして推定されたノイズスペクトルを元信号のスペクトルから減算し、ノイズ除去を行います。

実験結果では、このような結果が得られています。

画像:図1 衝撃性ノイズ低減の実験結果

図1 衝撃性ノイズ低減の実験結果

リコーが独自に開発した衝撃性ノイズ低減技術により、会議に不要なノイズ音の大幅低減を実現し、会話快適性を向上しました。

高性能エコーキャンセラー

従来技術の課題

従来技術によるエコーキャンセラーでは、以下の課題がありました。

  1. 特に音声や音楽などの有色信号に対し収束性が遅く残留エコーが残るため、会話がしにくくなる。

    収束性能とは、受聴者のスピーカとマイクとの間の音の伝わり方(伝達関数)の推定の精度および速度のことです。収束性が速い(伝達関数が正確かつ短時間で求まる)と、エコーの量が小さくなり、話しやすくなります。
  2. ロバスト性が小さく、受聴音、雑音といった外乱に対し、脆弱で音声が壊れるので、これを防ぐために送話音声を切断し一方通話(ボイススイッチ)になる傾向がある。相手が話しているときに自分が重ねて話す(ダブルトーク状態)と、自分の声が相手に届かないことがある。

    外乱(エアコンの音、ファンの音、受聴者の声など)があっても、推定した伝達関数の壊れ方ができるだけ小さい必要があり、壊れにくいシステムをロバストであると言います。これにより、同時通話(ダブルトーク)が可能になります。
  3. ワイドバンド化で収束性能が劣化する場合があり、高音質化を妨げる。

    ITインフラの発達で、ワイドバンド化により、従来の電話回線に比べ安価に大量の信号を送ることができます。伝達関数の推定システムがワイドバンド化に対応すれば、高品質音声が実現します。

音声性能を大幅に向上した本技術

本技術、高性能エコーキャンセラーでは、従来のエコーキャンセラーで一般的に用いられている方法(適応フィルタ、カルマンフィルタ)と異なり、外乱*からフィルタの出力の影響を最小化するという手法を用いています。
*外乱:フィルタ係数初期値誤り、未知系変動、観測信号に含まれる環境雑音

本技術により、従来技術の課題が下記のように改善されました。

  1. 従来技術に比べ、有色信号に対し収束性能が良く高速に収束し、エコー減衰量が高い。明瞭な通話で話しやすい。
  2. システムのロバスト性が高いため、周辺のノイズ音が大きい場合やスピーカからの相手の声が出ている時に受聴者が発話する場合(ダブルトーク状態)においても、高い収束性能を維持してエコーをキャンセルすることができる。話者・受聴者が同時に発話しても違和感なく自然な会話が可能。
  3. ワイドバンド化によるタップ数(デジタルフィルタの係数の個数)増加状況でも、伝達関数の推定システムの収束時間がほぼ変わらず処理が速いという特徴があるため、高音域まで通信可能。音声の高品質化を実現している。
画像:図2 ダブルトーク時のエコーキャンセル性能比較

図2 ダブルトーク時のエコーキャンセル性能比較

※本技術「高性能エコーキャンセラー」は、独立行政法人 科学技術振興機構の特許(J-高速H∞フィルタ:岩手大学工学部 西山清教授考案)をベースに、株式会社エー・アール・アイと共同開発しています。

その他の音声品質向上技術

衝撃性ノイズ低減技術、高性能エコーキャンセラー以外にも、ノイズサプレッサー(環境雑音を抑制)、オートゲインコントロール(送話音声レベルを一定化)、イコライザー、ダイナミックレンジ圧縮・伸長処理などを開発・実装し、音声品質を改良しました。

本技術の分類:分野別「ネットワーク」|製品別「テレビ会議・Web会議」