最終更新日:2024/04/23
会議やインタビューを文字起こしする際、発言内容を話し手ごとに聞き分けて書くことは大変な作業です。そこでおすすめなのが、AI文字起こしサービスの「自動話者分離」機能を使うことです。この機能を活用すると、AIが音声情報を解析し、自動的に発言者を識別して話者を分離することができます。話者分離機能を利用して、議事録やインタビュー記事の作業効率を向上してみませんか?
目次
- 話者分離機能を使った文字起こしの方法・流れ
- 1. 会議やインタビューを録音・録画する
- 2. 音声・動画ファイルをアップロード
- 3. 手動で話者ごとに文を改行
- 4. 手動で話者設定
- 5. 自動で話者情報を更新
- 話者分離を実行したあとのノート(文字起こし結果)表示
- 話者分離が正しくできていない箇所があった場合
- 話者分離機能を有効活用するためのコツ
- 話者分離機能で会議やインタビューの文字起こしを高速化
話者分離機能を使った文字起こしの方法・流れ
AI文字起こし/議事録ツール「Rimo Voice」は、話者分離機能を標準搭載しています。手動である程度の話者分離を行うと、残りの話者分離をAIが自動で行う機能です。
ここからは、話者分離機能を使った文字起こし方法をご紹介します。
1. 会議やインタビューを録音・録画する
できる限りノイズを減らし、クリアな音声を録音するようにしましょう。音声認識の精度が向上し、文字起こし結果のテキストを修正する手間が少なくなります。また話者分離の精度も高まります。
オフラインの場合は、スマートフォンのボイスメモアプリやICレコーダーで会話を録音します。発言者の音声をきれいに録音することができる位置に、スマートフォンやICレコーダーを置いてください。
Zoomなどオンラインの場合、Web会議ツールのレコーディング機能で録音・録画することができます。その際はマイク付きヘッドセットの使用をおすすめします。PC内蔵のマイクを使うときは、マイクの近くで発言するようにしましょう。
2. 音声・動画ファイルをアップロード
Rimo Voiceにログインし、 「ファイルをアップロード」もしくは「アップロード」をクリックします。
「ファイルを選択」もしくは「Drag & Drop」でファイル選択フィールドから、文字起こしをしたいファイルをアップロードします。 (音声・動画のURLを入力して文字起こしすることも可能です。またZoomなどと連携して文字起こしすることもできます) アップロード後、音声認識の解析が始まり、解析が完了すると文字起こしのテキストが表示されます。
3. 手動で話者ごとに文を改行
音声と話者名をAIに学習させるため、文字起こし結果を手動で話者ごとに改行します。 ※すべての参加者の発言箇所が10秒以上になる程度の話者分離を手動で行います。
文字起こしエリアの右上にある「編集する」ボタンをクリックして、編集モードにします。 (画面を縦に分割している縦線2本⏸のボタンにカーソルを合わせて左右に「Drag & Drop」すると、分割画面の幅を変えることができます)
「Enter」キーで改行して、発言者ごとの段落にします。
4. 手動で話者設定
話者ごとに改行した文に話者を追加し、参加者の名前を設定していきます。
まずページ右上に表示されている横線3本のボタンをクリックして、サイドパネルを表示します。
「話者分離」メニューが表示されるので、参加者を「編集する」をクリックします。
もしくは文字起こしテキストのタイムスタンプの右側に表示されている「話者を設定」をクリックし、「新しい話者を追加」をクリックします。
参加者を登録するポップアップが表示されます。参加者名を入力し、「Enter」キーもしくは「○○を追加」ボタンをクリックして、参加者を登録します。
参加者全員の登録ができたら、「保存」をクリックしてください。
3で話者ごとに分けた文に、登録した話者を設定します。文字起こしテキストのタイムスタンプの右側に表示されている「話者を設定」をクリックし、話者を当てはめます。
5. 自動で話者情報を更新
手動で話者設定を進めると、サイドパネルに参加者の発言箇所が何秒設定されたか緑色ゲージで表示されます。すべての参加者の発言箇所を10秒以上設定すると、「実行する」ボタンが有効になるのでクリックするとすべての発言を自動で話者分離します。
話者分離を実行したあとのノート(文字起こし結果)表示
①参加者の表示 文字起こしファイル名の下に、4で登録した参加者が表示されます。
②話者の確定 チェックマークが緑色の場合、話者設定が確定した状態です。
③話者が未確定 チェックマークがついていない場合、話者は未確定状態です。段落にカーソルをあわせると、グレーのチェックマークが表示されるので、マークをクリックして話者を確定します。必要に応じて「ここ以前のすべてにチェック」を選択してください。
話者分離が正しくできていない箇所があった場合
手動で発言箇所をさらに追加設定し、「再実行」してください。
話者分離機能を有効活用するためのコツ
音声認識の精度を高め、効果的な自動話者分離をするために、音声を録音する際は下記に注意しましょう。
- クリアな音声の確保 クリアで鮮明な音声は、話者分離の精度を向上させます。できる限り静かな環境で録音を行い、ノイズを低減しましょう。
- マイクに近づいて発言する 音声がクリアに記録されるように、発言者はマイクに近づき、言葉をはっきりと発音しましょう。パソコン内蔵のマイクではなく、オンライン会議に適したマイクやヘッドセットを活用することもおすすめです。
- 会話が被らないようにする 複数の人が同時に話すと音が混ざり、話者分離が難しくなります。会議やグループディスカッションでは、発言する順番を決めるなどして一度に話す人は1人だけになるようにしましょう。
話者分離機能で会議やインタビューの文字起こしを高速化
Rimo Voiceは長時間の会議・インタビューでも、AIが簡単に文字起こしと話者分離を行います。人間が行うとかなりの時間がかかる文字起こしを完全自動化でき、1時間程度の音声データの場合、アップロードから文字起こし完了まで約5分で完了します。文字起こしの際には「えー」「あー」といった言葉や余計な音を除去し、きれいな日本語に自動的に整えるので、読みやすい文章ができあがります。
また話者分離機能では、すべての参加者の発話箇所を10秒以上手動で設定すると、AIが自動で話者を分離します。人手での話者識別作業の手間と時間を大幅に削減することができ、会議の議事録・インタビュー記事作成の生産性向上につながります。
セキュリティ認証であるISMS(情報セキュリティマネジメントシステム)の国際規格「ISO/IEC 27001」と「ISO/IEC 27017」を取得しており、法人でも安心して使えることもRimo Voiceの魅力です。
会議やインタビュー等の文字起こしにお困りの方は、ぜひRimo Voiceを使ってみてください。