テレビ会議・Web会議システムにおいて、利用環境のネットワーク帯域に合わせて、利用シーンに最適な映像、音声および画面共有のメディア品質をリアルタイムに制御する、ダイナミックメディア制御技術。この技術によって、多様な状況においても快適なビジュアルコミュニケーションを継続的に提供することが可能です。
リコーでは、テレビ会議・Web会議システムRICOH Unified Communication System (以下、RICOH UCS)を通じて全てのお客様の通信環境で快適なビジュアルコミュニケーション(以下、VC)を提供することを目的として、さまざまな取り組みを行っています。ここでは、お客様への提供価値を高める取り組みのひとつである、「VC品質の確保」についてご紹介します。
RICOH UCSは、従来のテレビ会議・Web会議システムとは異なり、専用の部屋や専用のネットワークが不要で、利用場所の自由度が高いことを特徴としています。さらに、RICOH UCSはクラウドサービスであるため、異なる企業間でのテレビ会議も容易に行うことができます。利用場所の自由度が高いということは、ネットワークの状態や周囲の音声状況が異なるさまざまな環境でも利用できるということであり、どんな環境でも、画質、音声の聞こえやすさ、リップシンク(映像と音声の同期)、遅延の少なさを担保することが技術的な課題となっていました。
例えば、無線ネットワーク環境下では、電波状況によりRICOH UCSが利用できる帯域がとても狭かったり、大きく変動することがあります。そのような環境下でも可能な限りVC品質を確保するために、RICOH UCSでは、リアルタイムにメディア制御しています。
メディア | 品質 |
---|---|
音声 | ノイズの少ない、途切れない音声品質 |
映像 | 遅延が閾値を超えない範囲の映像品質 |
画面共有 | オリジナルと同等の画像品質 |
RICOH UCSは、主な使用用途として、担当者レベルでの気軽で自由闊達な打ち合わせを想定しています。このような「場」において、リコーでは、「会話のしやすさ」を1つの価値として提供することで、お客様の業務効率や知的生産性の向上につながると考えており、上記の各メディアが目指す品質は「会話のしやすさ」に基づいたVC品質評価の結果を反映しています。
「会話のしやすさ」の実現のためには、音声が最も重要で、映像は会話の補間情報として、表情、視線、ジェスチャといった言葉によらない非言語コミュニケーションのためのメディアであるといわれています。
そこで、上述したような利用可能帯域が狭い状況では、話している人、話すタイミングといった会話の補間情報が伝わることが、この状況下の映像の役割であると考え、画質は良いが遅延が大きな映像ではなく、画質は粗いが遅延の少ない映像に切り替えています。また、画質の粗い映像も通信できないような、さらに厳しいネットワーク環境下では、映像の通信を止めて音声のみの通信に動的に切り替わり、最低限のコミュニケーションを確保しています。
リコーでは、お客様の利用シーンや環境に合わせて快適なVCを提供するために、他にも「ネットワーク帯域を正確に検知する仕組み」、「コンテンツに最適な符号化技術」、「伝送遅延が与えるVC品質への影響」などをテーマとした基礎研究を進めており、研究成果を製品に素早く反映して、継続的な改善を行っています。
従来、テレビ会議・Web会議システムにおけるメディア制御技術では、以下のような問題があり、快適なVCの妨げとなっていました。
(1) 発話の衝突
ネットワーク帯域の変動に追随できなくなると、音声が遅れて送信されます。通信されるべき音声に遅延が発生すると、誰がいつ話し始めるのかが分からず、複数の人が同じタイミングで話し始めてしまうという発話の衝突が起こります。すると、会話が中断してしまい、発言の譲り合いや会話のリカバリーが参加者にとって大きなストレスとなります。
図1:発話の衝突による会話の中断が起き、困っている様子
(2) 画面共有のリアルタイム性低下
画面共有とは、PCに表示しているパワーポイントや動画などの画面を、テレビ会議・Web会議システムを通じて通信し、複数の参加者で共有することを指します。例えばパワーポイントのページ送り時など、画面変化が大きくなるとデータ量が瞬間的に大きくなります。その時、送信するデータ量に対してネットワーク帯域が不足すると遅延が生じてリアルタイム性が低下し、コミュニケーションが阻害されます
図2:説明者側のPCでページ送りした画面の共有がされていないのに説明が始まってしまい、混乱する様子
このような課題に着眼し、リコーは、以下のような特徴を備えるダイナミックメディア制御技術を開発しました。
(1) 音声のリアルタイム性の向上
VC品質評価の結果から、快適なVC品質の妨げになる主要な原因は、音声の遅延であるということが分かりました。そこで、音声、映像、画面共有の品質を表1の各メディアが目指す品質に基づいてリアルタイムに制御するなどの改善を行い、音声のリアルタイム性を向上、発話の衝突を抑制し、「会話のしやすさ」を実現しました。
図3:発話の衝突が起こらず、スムーズな会話が行われている様子
(2) 画面共有のリアルタイム性の向上
入力映像の画面変化が大きい場合にも、送信するデータ量が大きくなり過ぎないように抑制する処理を強化しました。これにより、画面共有のリアルタイム性が向上し、コミュニケーションが円滑化されます。
RICOH UCSでは、これらの技術により、テレビ会議・Web会議における「会話のしやすさ」を大幅に改善しました。
リコーは、これからも、お客様が利用する全ての通信環境において快適なVCを提供するために、「会話のしやすさ」を追求していきます。
本技術の分類:分野別「ネットワーク」|製品別「テレビ会議・Web会議」