AI
2024/10/03
上田 裕大

議事録自動生成プロダクトの機能比較

今回はいくつかの議事録自動生成プロダクトを比較するとともに、そのうちの1つの体験版を実際に使用して見たので、その内容をまとめます。

はじめに

生成系AIの進歩に応じて、ミーティングの録画やミーティングのリアルタイムの音声から議事録を自動で作成するサービスが多く提供されています。これらのサービスは、従来の議事録作成の手間を削減し、時間的なコスト削減ができるだけでなく、記録等を行う必要がないため会議中の参加者の集中力を高められるなど、多くのメリットがあります。
一方で、これらのサービスは今では大量に存在しています。そこで今回は、調査を目的としてこれらのサービスを比較し、一部のサービスについては使用したレビューをさせていただきたいと思います。

サービスを見る前に

種々のサービスを考える前に、まず、サービスにどのようなことを求めるのかを明らかにする必要があります。議事録自動作成ツールは大量のサービスがあるので、漠然と良いものを探しても論理的な選択ができません。ここでは、私が調査した中で判断する軸となりうる部分について以下の4つをあげさせていただきます。

1. どの程度使用し、どの程度の予算なのか
2. 議事録の生成においてどの部分まで行うのか
3. 多言語対応が必要か
4. 使用する環境に求めることがあるか

それぞれについて見ていきましょう。

どの程度使用し、どの程度の予算なのか
これは当たり前ですが、予算と使用の仕方についての話です。議事録作成ツールには、従量課金のものと買い切りのものがあります。基本的には前者の方が多いですが、多くのツールでは複数のプランが用意されていることが多いです。使用する条件に適したプランのあるサービスというのが1つの要件となります。

議事録の生成においてどの部分まで行うのか
2つ目がサービスの内容の根幹である議事録作成部分についてです。
全てのツールを実際に使用したわけではないので、HPから得られる情報のみからにはなってしまいますが、議事録作成ツールの中には文字起こしや話者分類の部分までにフォーカスしているものも多くあります。また、逆に議事録作成にとどまらずそれ以外の会議内容の見える化などまで行うツールもあります。そのツールでどのプロセスを自動化したいのかを事前に考える必要があります。この記事の後半でフォーカスするのは議事録を作成する部分までで、それ以上を求めないような議事録作成ツールを対象とします。

多言語対応が必要か
対象とする言語を日本語のみに絞ることによって、音声認識精度や議事録作成精度を向上させているようなサービスも多く存在します。対応言語を絞って精度を優先するのか、多言語に対応できるようなサービスを使用するのか、サービスの使用される状況を加味しながら検討する必要があります。

使用する環境に求めることがあるか
サービスの特徴としてどのような形でデータを保持するのかというものがあります。スタンドアロンな形でデータを保持することが必要なのか、オフラインでも使用できる必要があるのかなど、セキュリティや使用したい条件を軸に考えることも必要です。
それでは以上を踏まえて、種々のサービスを見ていきます。ただし、私の方でサービスを試用したものについては後述しますが、特記しない限り使用はせずに調査した内容をもとにまとめております。

プロダクト比較まとめ

Rimo Voice
 


  • ・ 日本語のみ

  • ・ zoom / teams / meetとの連携に対応

  • ・ 同時編集やジャンプ機能など

  • ・ 5分/1h の処理速度

  • ・ データセンターに保管

  • ・ 料金:月額30,000円〜、初期費用30,000円~



AI議事録取れる君(株式会社ALM)

  • ・ zoom/teams/meetとの連携に対応

  • ・ 多言語対応可能

  • ・ 固有名詞の登録

  • ・ 議事録データの出力の共有部分などの処理も豊富

  • ・ 料金:月額5,500円(10時間/月)~ 初期費用無料

  • ・ 1週間無料体験あるが、クレジットカード情報を入れる必要あり




AI GIJIROKU(株式会社オルツ)

  • ・ Zoom、Skype、Teams、Hangouts、Cisco Webexと連携可能

  • ・ 多言語対応可能

  • ・ パーソナライズを自動で行う(学習を行う)

  • ・ 文字起こしから議事録生成の部分が不明

  • ・ 料金:月額29,800円(100 時間/月)



VOITER(iFLYTEK JAPAN AI SOLUTIONS 株式会社)

  • ・ 議事録作成部分が微妙な気がする

  • ・ 専用ウェブアプリとしての実装なので、今後も新しい機能が追加されていく

  • ・ 国内のサーバーでデータ管理

  • ・ ノイズがある環境下でも正確に文字起こしできる部分が売り

  • ・ 料金:本体54,780円※使い放題プラン(月額2,180円)なら時間無制限で利用可能



AmiVoice®ScribeAssist(株式会社アドバンスト・メディア)

  • ・ 日本語のみ

  • ・ スタンドアローン

  • ・ 話者識別

  • ・ オフラインで動く

  • ・ 料金:要問い合わせ



AutoMemo(ソースネクスト株式会社)

  • ・ 20分/1hで音声処理、5分/1hで要約処理

  • ・ 容量無制限でクラウドに保存

  • ・ 話者分類

  • ・ 文字起こしのみ無料で試せる



Rimo Voice無料版を使って見た

文字起こし
Rimo Voiceは60分だけ無料で使用することが可能なので、それに社内の勉強会の録画を入れて見ました。25分ほどのmp4形式の動画でしたが、アップロードと音声処理・文字起こしに2~3分程度、そこから議事録の生成に2分程度かかりました。
ファイルアップロードでは、トップページのアップロードボタンを押すと以下のような表示となり、ファイルを選択してアップロードすることができました。


アップロードが完了すると下記1枚目の画像のように動画ファイルの名前で専用のページが作られました。これを開くと2枚目の画像のような形で文字起こしが動画と共に表示され、動画の再生箇所が赤く強調表示されるほか、テキストをクリックすると動画も該当箇所に飛ぶなど、直感的にわかりやすい形でテキストと動画が連携されていました。
また、文字起こしの内容については、動画を再生しながら編集できるようになっていました。



議事録の自動生成
さらに左側の画面では

・ 会話のまとめ
・ 議事録
・ 記事の作成・編集

といったテンプレートが選択できるようになっており、選択したテンプレートに合わせて文字起こしした内容をまとめたものが自動で作成されます。今回は議事録の作成をしたいので、議事録を選択します。
選択するとAIが自動で議事録の作成を進めていき2分程度で以下の内容ができました。


個人的な感想
まず、文字起こしについてです。日本語に特化しているとのことで外来語や日常的に使用されるような英単語(ドキュメント、ディスカッションなど)を含めて、ほぼ全ての内容を正しく文字起こしできていました。また、固有名詞についてもGoogleCloudやAzure、chatGPTなど有名どころについては正しく認識できていました。
一方で、依然としてGPTsやLookerといった固有名詞は正しく変換できないなど、不適切な文字起こしは生じますし、単語レベルでの登録機能やPersonalizeなどは提供されていないので、動画を見ながら人の手での修正は必須になるかと思います。使用する背景や議題に傾向がある場合やたくさんの議事録を生成する場合など、文字起こしに対して追加で学習を行った方がいいようなケースには向いていないと思います。
次に、文字起こしの内容から議事録を生成する部分についてですが、こちらについては抽出する情報が概ね適切で重要な部分や日付にフォーカスできている印象を受けました。ただし、それぞれの情報を議事録のどの部分に配置するのかやどのように区分するのかといった部分については、性能向上の余地があるのかなと感じました。ただ、これらの部分は人間が議事録を作成しても作成者によって変わってくる部分だと思いますので、それほど大きな欠点でもないように感じました。
サービス全体を通して見ると、議事録を作成する上で十分なUIや機能があるという印象で、また、作成された議事録についても、Personalize等を考えなければ高い水準にあると感じました。ただし、さらなる性能を求めるような場合にはPersonalizeの機能を持った同様のサービスとの比較が必要だと思います。

おわりに

今回は複数の議事録自動作成ツールを比較した上で、無料で試せるものとしてRimo Voiceを使用して見ました。今回は時間と手頃に動かせるという部分でRimo Voiceに限定していますが、多くの同様のサービスが同じような機能を提供していて、実際に使ってみると想像よりも良い・悪いがあると思うので、使ってみての比較は必須だと思います。

New call-to-action