キーボードの打鍵音などのノイズ音を低減する衝撃性ノイズ低減技術、および高性能エコーキャンセラーにより、テレビ会議・Web会議システムRICOH Unified Communication System (以下、RICOH UCS)の音声品質を大幅に向上しました。
衝撃性ノイズ(非定常ノイズ)とは、例えばキーボードの打鍵音、ボールペンのノック音、ボタンの押下音など、突発的に発生するノイズのことをさします。テレビ会議やWeb会議システムにおいて、この衝撃性ノイズは、会話が一瞬聞こえなくなるなど、コミュニケーションの妨げとなります。
衝撃性ノイズ低減技術は、この衝撃性ノイズの振幅スペクトルを推定して除去する技術です。RICOH UCSを介した音声からは衝撃性ノイズが大幅に低減されるため、ネットワーク越しの相手には、衝撃性ノイズが減衰された音声が聞こえます。
具体的な処理としては、まず、衝撃性ノイズの動的特徴(スペクトルの立ち上がりと減衰)を考慮して、ノイズスペクトルを推定します。この推定は、衝撃性ノイズの一般的な性質に基づいて行われるため、ノイズの種類や発生タイミングに依存することなく、またノイズが他の音声と重なっていても、スペクトルを高い精度で推定することができます。こうして推定されたノイズスペクトルを元信号のスペクトルから減算し、ノイズ除去を行います。
実験結果では、このような結果が得られています。
図1 衝撃性ノイズ低減の実験結果
リコーが独自に開発した衝撃性ノイズ低減技術により、会議に不要なノイズ音の大幅低減を実現し、会話快適性を向上しました。
従来技術によるエコーキャンセラーでは、以下の課題がありました。
本技術、高性能エコーキャンセラーでは、従来のエコーキャンセラーで一般的に用いられている方法(適応フィルタ、カルマンフィルタ)と異なり、外乱*からフィルタの出力の影響を最小化するという手法を用いています。
*外乱:フィルタ係数初期値誤り、未知系変動、観測信号に含まれる環境雑音
本技術により、従来技術の課題が下記のように改善されました。
図2 ダブルトーク時のエコーキャンセル性能比較
※本技術「高性能エコーキャンセラー」は、独立行政法人 科学技術振興機構の特許(J-高速H∞フィルタ:岩手大学工学部 西山清教授考案)をベースに、株式会社エー・アール・アイと共同開発しています。
衝撃性ノイズ低減技術、高性能エコーキャンセラー以外にも、ノイズサプレッサー(環境雑音を抑制)、オートゲインコントロール(送話音声レベルを一定化)、イコライザー、ダイナミックレンジ圧縮・伸長処理などを開発・実装し、音声品質を改良しました。
本技術の分類:分野別「ネットワーク」|製品別「テレビ会議・Web会議」