トランスクリプトで文字起こし

トランスクリプトで文字起こし

トランスクリプトで文字起こし


トランスクリプトとは

オンライン会議のサービスには多数のオプションが付属していますが、その中で「トランスクリプト(Transcript)」(またはトランスクリプション)という機能はご存知でしょうか。
「トランスクリプト」とは、本来は、転写物、写し、記録などの意味がありますが、最近では「話した内容を文書化する」という意味で使われることのほうが多いようです。

今までは会議の議事録作成のためには、ICレコーダーやスマホで録音したり、別途録音用のアプリケーションを利用したりする方も多かったのではないでしょうか。この機能を活用すると、オンライン会議での発言の内容が自動でテキストに変換され、議事録の作成などが効率的に行えるようになります。

Zoom、Microsoft Teams、Google Meetなどのメジャーなオンライン会議サービスには、リアルタイムで音声をテキストに変換するトランスクリプト機能が付属しています。

今回はトランスクリプト機能の使用方法を簡単に解説します。


トランスクリプト機能を持つオンライン会議サービス

Zoom

以前まではZoomの文字起こし機能は英語にしか対応していませんでしたが、2022年9月から日本語でも利用できるようになりました。Zoomではライブ文字起こし機能とよばれており、映画の字幕のように画面下側に字幕のように表示される「サブタイトル」方式と、サイドパネルに発言した内容を表示させる「フルスクリプト」方式の2つが選べるようになっています。無料プランでも利用可能なので気軽に試すことができます。

ライブ文字起こしの使用方法

Zoomでライブ文字起こしを利用する場合は、ZoomのWebサイト上で設定を有効にする必要があります。

  1. ZoomのWebサイトにログイン後「設定」から「ミーティング」にある「ミーティング内(詳細)」を選択します。

  2. ミーティング内(詳細)ページをスクロールしていくと、「自動字幕」とうい設定があるので、こちらを「有効」に変更します。

    自動字幕」の下に、「完全な文字起こし」(文字起こしを再度パネルで表示)と、「字幕を保存」という項目もあるので、「有効」にしておくと便利です。

以上で、Zoom上でライブ文字起こしを使用する設定は完了です。

Zoomを起動すると、メニューバーに新しく「字幕を表示」のボタンが追加されます。
こちら実行すると、音声が字幕で表示されるようになります。

Microsoft Teams

ライブトランスクリプションという機能が実装されており、オンライン会議の参加者の発言をリアルタイムで文字に起こして、画面に表示します。無償版では提供されておらず、「Microsoft Bussiness Basic」などの有料ライセンスが必要となりますので注意してください。

トランスクリプトの使用方法

  1. 「…」から「トランスクリプションの開始」を選択する

  2. 停止するときは、「…」から「トランスクリプションの停止」を選択します。または、参加者全員が退出すると、自動的にトランスクリプションが停止します。
    会議後、文字起こしされたファイルは、.docxまたは.vttファイルとしてダウンロードが可能です。

なお、対応しているライセンスではない場合、上記の画像のようにトランスクリプションの開始ができなくなっています。

Google Meet

Google社が提供するオンライン会議サービスなので、インストール不要でブラウザ上から簡単に利用できます。

文字起こしの使用方法

  1. 字幕の設定は、「CC」ボタンを押下することで、使用可能となります。

  2. デフォルトでは設定が「英語」になっているので日本語に変更してください。

    ※現在GoogleMeetでの字幕機能において、日本語はベータ版の状態になっています。

  3. 字幕をオンにして、マイクで話すと下記のように字幕が表示されます。

    ※「文字起こしのテスト」と話した際の字幕

3つのオンライン会議サービスのトランスクリプト機能の使い方をご案内しましたが、如何でしたでしょうか。
トランスクリプト機能を利用することで、簡易的な文字起こしは容易に行えるようにはなりました。議事録作成をするときや、会議の内容を振り返るときの素材、元データとしての活用が可能でしょう。

ただし、文字起こしの精度という点では、やはり人が行った文字起こしにはまだまだ劣ります。具体的には、音質も活舌も相当に状態が良くないと、同音異義語や空耳的な聞き違いも多く、また複数人の掛け合いになると発話者の区別もほとんどつけられないなど、実利用をするにはまだ条件が厳しいところがあります。


状態の悪い音声の文字起こし

下記のような悪条件の環境でトランスクリプトにて文字起こしをした場合、精度が著しく落ちる傾向にあります。

  • 録音環境が悪い(周囲の雑音、音楽、話し声など入る)
  • 早口
  • 活舌が悪い
  • 訛りが強い
  • 声が遠い(小さい)

音質が悪い環境でトランスクリプトによる文字起こし行った場合(×)と、弊社で文字起こしを行った場合()の例をご案内します。

  • ノイズが強いと…

    ×契約の中身をできるだけここでそこで一旦精算します。

    契約の中においては、出来上がっているところまでで一旦精算します。

  • 早口で活舌が悪いと…

    ×戦略員斎藤を家畜飼養と検討しています。

    戦略インサイトを構築しようと検討しています。

  • 方言が強いと…

    ×掃除したら、おちん友達が明日を知るというときに「年金は死んだらあの世でもらえるかね」って

    そうしたら、私の友達が明日は死ぬというときに「人間は死んでもあの世でも会えるかね」って

部分的に誤字脱字が混入している程度なら、特定の部分だけ後から手動で修正するということで精度を上げることもできますが、全体的にこのような状態の場合では個々に修正を行う方がかえって手間になる場合があります。


文字起こしの種類による特性

またトランスクリプト機能を利用した文字起こしは原則として、発言の内容がそのまますべて文字に書き起こされます。言い直しや言い間違い、「えー」「あのー」などのフィラーワードもそのまま書き起こされるので、文字起こしの種類としては「素起こし」と呼ばれる形式になります。

カウンセリングや裁判等の用途においては、言い間違いや戸惑いの雰囲気も含めて必要となることがよくあるので、「素起こし」でも活用しやすいのですが、会議の議事録や講演等においては、それらは不要とされることが多くあります。そのため一般的には会議や講演の文字起こしは、言い間違い等を除外した「ケバ取り」や文末や表記を統一して、文章全体を整えなおす「整文」の方がお勧めになります。

発言の一つ一つを深く吟味して、発言者の動機や精神的な心の動きまで捉えたいのか、会議の流れや大意を短時間でつかみたいというような読み易さを重視するかは、文字起こしをした文章の利用用途によります。

お客様の中には、数年分の理事会や会議の音声データを、文字起こしソフトやトランスクリプト機能をご利用し文字起こしされた後、記録として保管できる品質ではないとのことで、弊社に「ケバ取り」や「整文」でご依頼いただくことが多数ございます。
より正確な文字起こしデータが必要となる場合は、データグリーンへのご依頼をご検討ください。

精度の高い音声・動画データの文字起こしが必要な時

データグリーンなら

音声認識を利用した文字起こしで対応ができない場合、あるいはもっと精度の高い音声・動画データの文字起こしが必要な時はデータグリーンのサービスをご利用ください。 AIによる音声データの解析技術と熟練ライターの豊富な経験・ノウハウを組み合わせた「精度の高い文字起こし、テープ起こし」をご提供できます。音質が悪いデータや長時間の文字起こしにも低価格、年中無休で対応しておりますので、週末のご依頼でも土日や祝日の納品が可能です。また、プライバシーマークおよび情報セキュリティマネジメントシステムの国際規格「ISO27001(ISMS)」の認証も取得しておりますので、秘匿性、機密性の高い音声データの文字起こし、テープ起こしもおまかせください。

お電話からお問い合わせ

0570-550-729

年中無休

平日
9時〜18時
土日祝
9時〜13時

※年末年始、GW、お盆期間は休業

Webからの
お問い合わせ・無料お見積り

広告ムービー