• 株式会社RevComm
  • 執行役員 リサーチディレクター
  • 橋本 泰一

アジアで唯一「Forbes AI 50 2023」に選出。レブコムが研究開発・産学連携に注力する理由

AIの台頭によってサービスや製品が急速に進化している昨今、企業における研究開発の重要性がますます高まっている。そんな中で、AIを活用した音声解析や音声認識、音声合成の分野においてイノベーティブな研究開発を続けているスタートアップ企業が株式会社RevComm(レブコム)である。

音声解析AI電話「MiiTel(ミーテル)」や、AI搭載オンライン会議解析ツール「MiiTel Meetings」などを開発・提供する同社は、世界で最も注目を集めるAI企業を表彰する米国「Forbes AI 50 2023」に、アジア企業として唯一選出された。

また、デロイト トーマツ グループが発表したテクノロジー企業成長率ランキング「Technology Fast 50 2022」にて1位を受賞するなど、多くの受賞歴を持つ同社は、2017年の創業時からAI活用やリモートワークが広がる未来を見越してビジネス戦略を立て、開発を進めてきたという。

そして直近では、2023年1月に研究開発組織「RevComm Research」を設立し、さらなる技術開発と産学連携の取り組みに注力しているそうだ。同社の執行役員 兼 リサーチディレクターとして本組織を管掌する橋本 泰一さんは、「近年はスタートアップ企業でも研究開発が欠かせないものになってきている」と話す。

そこで今回は橋本さんに、「RevComm Research」の活動や産学連携の取り組みなどについて、詳しくお話を伺った。

リモートが広がる未来を見越して「MiiTel」を展開し、事業が急成長

私は東京工業大学にて博士号を取得した後、助教授や特任准教授として約9年間、自然言語処理の研究に従事していました。

その後、「AI技術を組み込んだ世の中の役に立つ製品を多くの方に届けたい」と考えたことと、後進の研究者や学生たちに、企業でAI技術を研究開発して生きていく道があると示したいと思ったことから、30代後半でフィールドを企業に移しました。

そして数社で経験を重ねる中で、特に音声サービスや音声AI技術に大きな可能性を感じて、2021年にレブコムに入社しました。

▼執行役員 リサーチディレクター 橋本 泰一さん

弊社は2017年の創業時から、「AI技術を活用してビジネスシーンにおけるコミュニケーション課題を解決すること」を目指して開発を進めています。その主軸となる音声解析AI搭載型のクラウドIP電話「MiiTel」は、ブラックボックス化しやすい営業電話や顧客応対の音声データをAIが分析・可視化し、​成約率の向上などを後押しするサービスです。

2018年のリリース後は、「TechCrunch Tokyo 2019」などの受賞に加えて、経済産業省が推進する「J-Startup企業」にも選定いただけたことで、先進的なプロダクトを開発している企業だという認知獲得や資金調達にもつながりましたが、特にレブコムの大きな成長の転機となったのはコロナ禍でした。

「MiiTel」はクラウドPBXと言われる、インターネット網さえあればどこからでも会社の電話番号で電話ができる仕組みなので、このシステムが世の中のリモートワーク需要とマッチしたんですね。

もちろんコロナ禍を予測していたわけではありませんが、弊社では創業時から「リモートワークをベースとしたフレキシブルな企業が増えるだろうから、自宅でもどこでも使えるサービスを前提に戦略を立てよう」と考えていました。そうした未来に備えて、高い技術力を持つメンバーが集結して研究開発を続けてきたことが、今の事業成長につながっていると考えています。

AI技術の開発と産学連携を行う研究開発組織「RevComm Research」を発足

弊社ではこの数年、「人を集め、育てていく」ことを重視して、大学の研究室との共同開発を増やしたり、アカデミックな領域で論文を発表したりすることに注力してきました。

というのも、研究開発にたずさわる私たちは以前から、「大規模なAIイノベーションが起きる可能性がある」とひしひしと感じていたからです。そんな中で、2022年後半にChatGPTのリリースや画像生成AIの製品化などが大きなブームを起こし、一気にAIが身近になったと感じた方も多いと思います。

こうした大転換期に、企業として新たなイノベーションを打ち出すこと、そしてその研究に投資することは非常に重要だと考え、2023年1月にAI技術の開発を強化する研究開発組織として発足したのが「RevComm Research(以下、RCR)」です。

現在、RCRにはリサーチャーとエンジニアを合わせて20名ほどが所属しています。その約半数を外国籍のメンバーが占めていることが大きな特徴です。

この背景には日本国内のIT人材不足があり、今後も積極的に外国籍人材を採用していきたいと考えていますし、日本人メンバーのスキルアップにつなげることも考えて、RCR内では英語でコミュニケーションを取るようにしています。

また、現在のRCRにおける研究開発の内容は、主にAI技術を活用した音声解析(音声認識、音声合成、音声感情認識)、自然言語処理(対話要約、対話理解)、動画像処理です。これらの研究開発は企業内にとどまらず、大学研究室と連携した共同研究も多く行っています。

共同研究や産学連携が、採用や企業認知の拡大にも寄与している​​

RCRの設立前も含めて、長年に渡り自社での研究開発を進めてきた成果として、製品に機能搭載した実例をいくつかご紹介できればと思います。

まず、特徴的なものとして「音声感情認識」機能があります。これは、話者がどんな気持ちで話しているかを推測するエンジンで、筑波大学との共同研究を通じてプロダクト化しました。

▼話者の感情をAIが分析・可視化する「音声感情認識」機能(イメージ)

どのようにAIが感情を推測するかについては、大きく分けて3つの判断基準を用いています。

1つ目は、音の変化による判別です。例えば、怒っている時の声は少し低くなったり、ドスが効いていたりしますよね。逆に、喜んでいる時の声は高くなります。そうした声の高低や抑揚といった、発せられる音の変化を計測することで感情を推測しています。

2つ目は、テキスト情報からの推測です。嬉しい時や悲しい時など、それぞれの感情にあわせてよく使われている言葉を学習して判断しています。

3つ目は、話している内容をAIが正確に認識できているかどうかです。例えば「相手が怒りすぎて、何を言っているのか分からない」というケースがあります。そのように感情が強すぎる音声はAIが正確に読み取れないことがあるので、そのスコアも考慮しています。

このようにして話者の感情を可視化することで、企業活動においては顧客対応に問題がないかや適切な応対ができているのかなど、コミュニケーションの課題を見つけやすくなると思います。

その他にも、入力したテキストを自動で音声化して応答できる「音声合成技術」は、電話応対において、着信時に再生する自動音声を設定し、要件に応じて着信先を振り分けることができます。これによって電話の取次を減らし、対応効率を上げることができるので、今ではこの機能を多くの企業でも活用していただいています。

また、音声データをAIがテキスト化する際に、クレジットカード番号などの個人情報を自動でマスキングする技術なども開発し、製品に組み込んできました。

さらに、2023年5月にはLLM(Large Language Model)を使った新たな要約機能も開発しました。これは、電話やオンライン会議で話された議題や提案内容、決定事項などをAIが抽出して議事録化してくれる機能です。

具体的には、「今回の電話では製品について話をしました。製品の導入は10月に決まりました。次のアクションとして、〇月〇日に価格について話し合うことになっています」といった形で整理して要約してくれる形です。この機能がリリースできたことは、RCR設立後の大きな成果ですね。

▼MiiTel Meetings「議事録要約」機能(イメージ)

産学連携については、先ほどお話しした筑波大学さんとの共同研究を一例として、研究室の学生さんと論文を書いたり、その学生さんたちをインターンとして受け入れたりなどの活動も行っています。そこで関わった方々がその後弊社に入社してくれることもあり、産学連携は採用面においても効果が現れていると感じますね。

また、学会での論文発表をきっかけに、レブコムを認知していただくことも多いと感じています。実際に、大手企業のシニアリサーチャーの方から「スタートアップでこれだけ論文活動をされている企業はめずらしく、以前から気になっていました」と転職希望のご相談をいただいたこともあります。

このようなアカデミアの活動を通じて、若い人に限らず、シニアの研究者の方たちにも、私たちの研究や取り組み、プロダクトを知ってもらう機会が確実に増えていると感じます。

次の研究課題は、他国語・多言語の音声技術をいかに開発するか

今後の研究課題としては、多言語プロダクトの開発があります。現在、インドネシアとアメリカでもサービスを展開していますが、海外で弊社のプロダクトを展開する場合、当然ながら国ごとの言語での音声認識機能を開発しなくてはなりません。

AI技術というのはとにかく膨大なデータを集め、学習していかないと何も実行できないですし、初期の段階では課題すら分からない分野です。その点、さまざまな場面での音声コミュニケーションデータを、「MiiTel」のサービスを通じて所有できていることは、私たちの非常に大きなアドバンテージとなっています。

しかし、今まで蓄積してきたデータはほとんどが日本語音声で、英語やインドネシア語のデータはまだ少ない状況なんです。その中で、いかに言語の壁を超えて、海外でも同じレベルの技術を提供できるようにするのかは大きな課題です。

さらに、アメリカの場合は英語が中心であるものの、スペイン語や中国語で話すケースも多く、多言語での音声コミュニケーションにどのように対応するかという問題もあります。そのような背景から、多言語での音声技術開発が、私たちが次に乗り越えるべき課題だと考えています。

加えて、今後は音声解析で書き起こしたデータをいかにビジネスで活用していくことができるかが重要だと思っています。ブラックボックス化しやすい会話をデータとして蓄積・解析することで、例えば上司と部下の間のコミュニケーションが適切であったかを客観的に判断して、ハラスメントを未然に防ぐこともできるようになるでしょう。

そのように今までは記録として残らなかった音声データから新しい価値を作り出すことを、私たちは「音声データのアセット化」と呼んでいます。その取り組みによって、人々のコミュニケーションがより適切なものに変化していく。そうした世の中を作っていくことも、企業としての大きな目標です。

変化の速い現代は、スタートアップでもアカデミックな研究開発が必要

振り返ると、この1年でAI技術が大きな転換期を迎え、これまで出来なかったことが実現したり、さらに一段階性能が上がったりしたことがたくさんあると思っています。

多くの人が感じているように、今は新しいアルゴリズムや手法、技術が出てきた時に、それが製品化される速度が非常に速くなっています。実際に、新しいアルゴリズムが論文として提示された数ヶ月後には、GAFAなどの大企業もスタートアップ企業も、その技術を組み込んだ新製品や新サービス、既存製品のバージョンアップをリリースしている状況です。

そのような時代なので、スタートアップ企業でも、もはや研究開発は欠かせないものになってきていると思います。特に、AIなどの機械学習を応用したサービス、もしくはそれを組み込んだサービスを提供するのであれば、アカデミックな研究開発は必須になるのではないでしょうか。

だからこそ、大企業だけでなくスタートアップ企業も、常にアカデミアの状況や新技術の動向をウォッチしていなければいけないし、それを自分たちで吸収して研究開発していくことが必要だと思います。これからのスタートアップ企業は積極的に、自社での研究開発や産学連携に力を入れてほしいですね。

また、私は若い人が引っ張っていくのが研究開発やAIの分野だと思っています。レブコムではそういう若い人がチャレンジできる環境を用意しているので、興味のある方はぜひ一緒に取り組んでいただけたらと思っています。(了)

【読者特典・無料ダウンロード】UPSIDER/10X/ゆめみが語る
「エンジニア・デザイナー・PMの連携を強める方法」

Webメディア「SELECK」が実施するオンラインイベント「SELECK LIVE!」より、【エンジニア・デザイナー・PMの連携を強めるには?】をテーマにしたイベントレポートをお届けします。

異職種メンバーの連携を強めるために、UPSIDER、10X、ゆめみの3社がどのような取り組みをしているのか、リアルな経験談をお聞きしています。

▼登壇企業一覧
株式会社UPSIDER / 株式会社10X / 株式会社ゆめみ

無料ダウンロードはこちら!

;