目次
デジタルサービスの会社として、「"はたらく"に歓びを」をミッション&ビジョンに掲げるリコーグループ。そんなリコーで働く社員は、仕事の中でどのように「"はたらく"に歓び」を実現しているのでしょうか。リコーのテレビCM「社員が語るストーリー」に出演し、開発中のリコーAIエージェントに対する思いを語っているAIエンジニアの後藤悠斗さんに、仕事で大切にしていることや、今後の目標を語ってもらいました。
デジタル戦略部 DTC 営業DX開発室 VDSA開発グループ
後藤 悠斗氏
後藤さんが所属されている部署は、どのような開発を手がけているのでしょうか。
後藤: 営業スタッフ向けのDXシステムを開発する部署です。具体的には、見る、聞く、考える、話すことができ、商談に役立つ情報を提供して営業をサポートするバーチャルヒューマン「リコーAIエージェント」の開発がミッションです。最終的にはAIエージェントがお客様と直接商談ができるというところを目指していますが、現段階では、AIエージェントが営業スタッフに同行して商談をサポートするシステムを開発中です。
その中で、後藤さんはどのようなお仕事を担っているのでしょうか。
後藤: リコーAIエージェントの実用化に向けたシステムやアプリの開発を担当しています。私たちのグループで開発した音声認識エンジンをAIエージェントの入力のインターフェースとして利用して対話機能と連携させたり、実際にバーチャルヒューマンを動かして、ユーザーとのインタラクションを確認しながら開発を進めるのが、私のメインの仕事です。
現在の勤務スタイルとしては、リモートワークが多いのでしょうか?
後藤: はい、ほとんどリモートワークで、月に数回は出社していますね。ただ、今、私がバーチャルヒューマンチームのリーダーも務めているので、メンバーと連携して仕事を進めています。音声認識の要素技術を開発するチームや、対話を担うAIの脳にあたる部分を開発するチームとも連携しながらシステムを作っていますね。バーチャルヒューマンチームには介護向けのバーチャルヒューマンを作っているメンバーもいるのですが、開発で共通する部分も多いので、そういった部分でも連携をとっています。
システム開発や、チームのリーダーとしてお仕事をする上で、大切にしていることは何ですか?
後藤: AIは特に進化が早い分野で、AIエージェントの動きを表現するグラフィカルの技術も日々、進歩しているので、仕事を自分の中にとどめないことは心がけています。いつまでも自分だけで考えていても仕方がないので、開発が進んだらできるだけ細かく見せられるものを作って、周りの人や上司にデモをします。そこでフィードバックをもらい、改善していくことは意識していますね。
後藤 悠斗氏
これまでのキャリアについてもうかがいたいのですが、リコーの志望動機や、入社してリコーでやりたかったことは何だったのでしょうか。
後藤: 大学で映像品質評価の研究をしていたので、ハードウェアとしてビデオ会議システムを持っているリコーに興味を持ちました。入社後は研究所に配属されて、実際にビデオ会議システムの映像品質評価に携わることができました。
その後、スマートグラスのPoC向けのアプリ開発や、VRを使ったコミュニケーションシステムの検証を担当した後、部署の研究分野が音声認識に移りました。その中で、口の動きから内容を理解する機械読唇の技術や、それと音声認識を組み合わせたマルチモーダルAI(複数の種類のデータを統合的に処理する技術)の研究をしてきました。これまでの画像関連や音声認識の研究開発経験から、それらの技術をつなげるバーチャルヒューマンシステムの開発を任せてもらったのだと思っています。
仕事をする中で"はたらく"歓びを感じるのは、どんな時ですか?
後藤: 今はリコーAIエージェントの実用化に向けた開発段階なので、歓びはこれから感じていくのではないかと思っています。CMで私が「音声認識・対話AIが商談のニーズを捉え、提言することで、"はたらく"を創造的にする」と語っていることが実現できたときに、歓びを感じたいですね。
普段のお仕事の中で、苦労されることや大変なことは何ですか?
後藤: 世の中のAIの進化が速すぎるので、自分たちが作ったものが明日には陳腐化している可能性があるというプレッシャーは感じます。それと、先ほどお話したように、できたものを細かく見せていくことをやっているがゆえに、「じゃあそれを展示会で発表しよう」となることもあって。発展途上の技術を社外の方にお見せするというプレッシャーがありますし、準備も大変です(笑)。展示会ではまだ開発中の技術だということはお伝えした上で、お客様のビジネスの参考にしていただいています。
社内だけでなく社外の方にお見せするとなると緊張感があって大変そうですね。社外に発表することで気付きを得られたり、準備をする中で整理ができたりして前に進むこともあるのでは?
後藤: はい、もちろんポジティブな部分もあります。展示会でお客様からいただいたフィードバックを受けて改善していくということは、実際にやっています。
出演したテレビCMでは、登場する実際のAIエージェントの動きの調整なども後藤さんが手がけたと聞きました。改めて、CM制作を振り返っていかがでしたか?
後藤: すごく明るいスタジオで撮影してもらって、緊張しました。自分用の控室も用意されていて、至れり尽くせりでビックリしましたね(笑)。自分がどんな仕事をしているのか、普段、家族や周りに話すことがあまりないので、30秒でそれが伝わるものを作ってもらえて、ありがたかったです。
自分自身にとっても、今、取り組んでいることのゴールを明確にできたのが良かったですね。世の中の変化に柔軟に対応をしていかなければならないものの、ゴールがブレたら開発は進みません。CMで語ったことが、我々がこれから実現しなければいけないことだと改めて確認ができました。
CM撮影現場
ご家族や、周りの方の反応や感想はいかがでしたか?
後藤: 笑われました(笑)。「すごいね」とも言ってもらえましたね。本心かはわかりませんが(笑)。
社内外からも反響はありましたか?
後藤: 元同僚の友人から「電車で見たよ」という連絡を受けて、恥ずかしかったです(笑)。つい先日もリコーのイベントに参加した別部署の同期からも「CM、見たよ」と言われましたし、反響は大きいです。お客様に対しても、リコーのAIエージェントについてわかりやすくお伝えできる資料になればいいなと思いますね。
今後の後藤さんやチームの目標を教えてください。
後藤: AIエージェントは現状、物珍しく関心を持っていただけるというレベルだと思っているので、実際にリコージャパンの営業担当に使ってもらえる完成度にしていきたいと思っています。「見る」「聞く」「話す」のうち、特に「見る」の部分の開発はまだこれからという段階で、世の中的にもホットな分野です。それが実現できれば、音声入力だけでは限界がある機能も実現できると思っています。
「見る」の機能によって、具体的にはどのようなことが可能になるのでしょうか?
後藤: 現状の仕組みは、たとえば、人の発話が人に向けたものなのか、AIエージェントに向けたものなのかをリアルタイムに正確に分析するのは、音声情報だけだと難しいんですね。「見る」、つまり映像も使うと、人がAIエージェントのほうを向いて話しているなどの情報が得られて発話の対象を検出しやすくなります。つまり、AI解析の精度をより上げることができるんです。私自身、映像による音声認識の研究もしてきたので、こうしたマルチモーダルの開発に本格的に取り組んでいくのが当面の目標です。
リコーAIエージェントの実用化は、どのようなステップで進めていく見込みでしょうか。
後藤: 段階的に進めていきます。まずは音声情報を使ったAIエージェントを実用化して、次の段階で、映像入力によって制度を上げたものへ、バージョンアップさせていきたいです。
リコーAIエージェントの開発によって、どのような"はたらく"の未来を実現したいと考えていますか?
後藤: 熟練の営業マンだとしても、個人の知識だけでは引き出せない顧客のニーズや、実現できない商談というのはあると思います。そういった部分を助けるAIエージェントを開発することで、部署のミッションであるバーチャル営業を実現して、はたらく人の創造性を引き出したいですね。