音声データの品質と文字起こしの精度
データグリーンでは文字起こしの精度と品質向上のため、日々様々な努力と工夫を重ねています。音声の録音の際に気を付けたり、録音内容についての補足情報をいただけるだけで、文字起こしの精度を向上させることが可能です。よろしければご依頼の前にご一読ください。
音声データの品質を上げるためのチェックリスト付き!
音声データの品質について
文字起こしの精度は、音声データの品質に比例すると言っても過言ではありません。文字起こしにかかる費用も変動します。またあまりにも低品質な音声データの場合はお断りさせていただくこともあります。
音質の悪いデータでも音量の増幅調節やノイズの除去などある程度は可能ですが、どうしても限界がございます。
音声の録音には様々なコツがありますので、できるだけ音質がクリアになるよう、「音声データの品質を上げるためのテクニック」をご案内いたします。
ICレコーダー
ICレコーダーでの録音時の注意点
ICレコーダーはマイクに近い音を大きく拾う特徴があります。
ICレコーダーで録音後に音声を聞き直してみると、その場では特に気にならなかった空調音や用紙・衣服を擦るようなノイズ音が入り込み、発言者の音声が非常に聞き取りづらいということがよくあります。人間の耳は中々便利にできており、ノイズや雑音だらけの場所でも目当ての人の声だけはきちんと聞き取ってくれる(カクテルパーティー効果)ことがあるため、録音データを聞き返して初めてノイズに気付くことがあります。
前述のように、ノイズが入った録音データを後から加工するのは難易度が高いため、ノイズが入らないように気を付ける必要があります。
Case 01ポケットやカバンなどに入れて録音する場合
例えばICレコーダーを胸ポケットなどに入れた状態で録音をされるのは、音質の面からおすすめできません。どうしてもポケットやカバンなどに入れて録音する必要がある場合は、事前に何度か録音を試して、多少でも音質がよくなる状態を確認しておくことが重要です。動かないように固定することや、マイクの向きやマイクを塞がないこと、揺すったりしないことなどに気を付けながら検証しましょう。
Case 02ICレコーダーを机の上に置ける場合
振動防止のため下にハンカチなどを敷きましょう。また資料などが手元にある場合、紙をめくる音は案外大きなノイズ音になりますので、場所や向きに気を配りましょう。
Case 03対面でのインタビュー形式の場合
ICレコーダーのマイクはできるだけメインの発言者に向けて、ぎりぎりまで近づけるのもよいでしょう。複数人での会談の場合はICレコーダーの最適の位置がどこになるのかも事前に確認しておくことをおすすめします。
Case 04広い場所で録音する場合
会議室等
机の設置状態にもよりますが、ICレコーダーは参加者全員との距離が均等になる場所に設置します。マイクの性能・機能は機種毎に大きく変わるため、最適な位置がどこか中々特定できませんが、事前に録音を試して音声品質を確認しておきましょう。
また人数が多い場合は、複数のICレコーダーを設置することもおすすめです。
ホテルや会場などの大きな施設
録音機材があらかじめ備わっており、音響スタッフが常駐されている場合もあります。そういった場合は、まずは専門のスタッフの方に直接相談しましょう。録音機材があればICレコーダーと直接ライン接続ができるので、非常にクリアで高品質な録音ができます。
機材が利用できない場合、講演会などでは本番の一発取りになりがちなので、複数の録音パターンを用意することがおすすめです。例えば講演者の傍と、スピーカー傍それぞれにICレコーダーを置くなどです。
ICレコーダー(ボイスレコーダー)の性能
ICレコーダー機器の選定も重要になります。まず音質に大きく影響するマイクの性能は当然のように値段に比例するので、ある程度の価格帯のものを選ばれることをおすすめします。また最近の高機能なICレコーダーは豊富に機能がついている分、どの機能に注目すればよいのかわかりにくいことがよくあります。単純にコンパクト化を追求したため高額になっているということもよくあるので、文字起こしに使用することを前提に、重視した方が良い機能をご案内します。
文字起こしで重視したい機能
- ステレオ録音
- 複数の発言者が要る場合、音の方向の違いが分かりやすくなり、聞き分けがしやすくなります。
- ノイズカット/ノイズキャンセリング
- 周囲の雑音を自動的にカットしてくれます。空調、紙や洋服の擦れ音などの小さいノイズ音が録音に入りにくくなります。
- トーン強調
- 声質にあわせてトーンを自動調整してくれます。例えばボソボソとした発音でもクリアに聞こえるようになど。ボイス用などの名称がついている場合もあります。
- リミッター機能
- 大きな音でも音割れを防ぐなどの効果が期待できます。
- マイク調整機能
- 人数や部屋の広さに合わせてマイクの感度や指向性を調整できます。
逆に文字起こし目的の場合には不要な機能もあります。
例えば、繰り返し再生や再生速度の調節機能などは、語学の習い事などの際には便利ですが、ご自身で文字起こしをしないのであれば不要です。
またリニアPCMやハイレゾへの対応があると、非常に質の高い録音が可能にはなりますが、音質をあげすぎるとデータのサイズも著しく大きくなり、長時間の会議の録音などには使いづらくなることがあるので注意してください。特に高価格帯のICレコーダーになると、ちょっとした音質の違いにこだわるミュージシャンなどの特殊な業界向けのものもあり、文字起こしの場合ではそこまでのものは必要ありません。
それ以外の性能については、例えば常に持ち歩く必要があるなら、コンパクトサイズのICレコーダーを、いつでもどこでもすぐに録音できるのがいいならワンタッチでスムーズに開始できるICレコーダーを、バッテリーの持ち時間についての要望など実際の使用状況に応じて重視する機能にあわせて選定しましょう。
ICレコーダー使用の際のその他の注意事項
- 音質の設定モードがついている場合は高音質設定にする。
- 録音中に誤って停止などさせないように、ホールドスイッチをONにする。
- パソコンなどの音を発生しているものがあれば可能な限り遠ざける。
- 環境音の混入はできるだけ抑える。窓やドアを閉めるなど、できることはできるだけやる。喫茶店などでしたらできるだけ奥の席をお願いすることや、BGMを止めてもらうことは難しくても、音量を下げるぐらいの希望は案外きいてもらえます。
- データの消失やトラブルに備えて、録音後はすぐにバックアップ。パソコンやスマホを使って、ファイルを移動するのではなくコピーすること。
障害やトラブルが発生し、データが消失してしまった場合でも、「データレスキューセンター」で音声や動画データを復旧した後に文字起こしを行うことが可能です。
電話
電話の録音について
固定電話やスマートフォンの携帯電話での録音についても簡単に紹介します。
電話録音には大きく分けて3つの方法があります。
Case 01もともと付属している機能を利用する
固定電話の場合、振り込め詐欺やイタズラ電話などに対策した高機能な電話機には、録音機能もほぼ付属しており、ボタンを押すだけで簡単に録音することが可能です。直接的な録音になるので音質も非常によくなります。
Androidの場合は機種にもよりますが、標準で録音機能が付属している場合があります。通話メモや音声メモなどの名称になっており、ワンタッチですぐに録音が開始できます。ただし最低限の機能しかありませんので、その都度操作する必要があったり、録音時間や件数に制限があったり、音質も最低限のものだったりすることがあります。
なおiPhoneにはデフォルトでは通話録音機能はついていませんが、これは国によっては通話録音自体の違法性が高いことに起因しているようです。そのため、他の方法をとる必要があります。
Case 02Androidのアプリケーションを利用する
通話録音用のアプリは非常に豊富に出揃っています。録音の自動開始設定や、音質も選べることが多いので、標準で録音アプリが付属していない、もしくは機能が低すぎる場合はこちらに切り替えることをおすすめします。
※iPhoneは通話録音機能そのものが制限されているため、他の方法をとる必要があります。
Case 03外付けの機器を利用する
専用ケーブルやマイク・イヤホン、ICレコーダーなどを別途導入して録音することも可能です。アプリを使った録音では制限がかかるケースもありますが、それらがほぼなくなり、自由度は高くなります。ただし、音質は録音の仕方次第で大きくかわります。
固定電話の場合は、敢えて外付け機器を利用するメリットも薄いので最初から付属機能が備わった電話機の利用がおすすめになります。
Androidの場合は導入コストと音質等とのトレードオフになるので、状況に応じて検討しましょう。
iPhone利用時の注意
iPhoneには前述のとおり本体上に制限がかかっているので、外付けの機器を利用するしかありません。
アナログ的な手法を経由する必要があるため、録音時には注意事項が幾つかあります。
一番簡単な手段としては、ICレコーダーを受話器にできるだけ近付けて録音するという方法がありますが、これはあくまでも最終手段です。
この方法で録音されたデータは音声のバランスが悪くなります。具体的には自分の声が大きく割れるようになり、電話の相手の声は小さくノイズ混じりとなり、文字起こしの難易度が高い音源となってしまいます。
そのためこの方法で録音する場合は、まず机の上など安定した場所にiPhoneを置きスピーカー機能を使って音声を出力させます。ICレコーダーの位置は、1対1の対面でインタビューをする時と同様に自分とiPhoneの中間あたりに配置しましょう。実際の配置場所やマイクの向きなどは、音量のバランスを考慮していろいろ試してみることをおすすめいたします。
オンライン会議
オンライン会議の注意事項
コロナ以降一般化したオンライン会議ですが、音質を上げる一工夫やマナーについては、まだ一般的にはなっていないようです。
代表的な注意事項を確認しておきます。
- 画面越しの応対のため、タイミングがとりにくく発言が被ることが多いようです。発言が被ると聞き取りにくい音声になるので、発言の順番をあらかじめ決めておくか、司会の方が率先して指名して会議を進めるようにしましょう。
- 参加者の数だけPC周りの環境も異なり、音質も大きく変わってきます。単純にマイクの向きやパソコンの設定一つで大きく改善することもあるので、事前に録音テストをしておきましょう。
- 録音の際には、オンライン会議のツールに必ずといっていいほど付属している録音機能で直接とることおすすめします。スピーカー越しに間接的な録音をすると、大きく劣化するのでおすすめできません。
データの形式
音声ファイルの形式
通常の録音機器で採用されている音声ファイルも音楽ファイルと同様にaac、aif、m4a、mp3、wma、などの圧縮された音声形式が一般的です。特にどの形式がおすすめということはなく、圧縮率の高いmp3でもビットレート128kbps以上であれば十分に聞き取りは可能です。
最上位の音質としてwav(リニアPCM)が用意されている場合もあります。音質がいいほど文字起こしの難易度は下がりますが、wavまでになると圧縮率が低いためサイズが非常に大きくなります。保存先メディアの空きと、会議やインタビューの予定時間まで考慮する必要があるので注意が必要です。
他にメーカー独自形式、dss(オリンパス)、msv/dvf/ics(ソニー)、dmr/dvr(東芝)、vm1(パナソニック)などもあります。これらは音質が悪いわけではありませんが一般的な再生プレイヤーでは対応していないことが多いので、使い勝手が悪くなります。mp3などの一般的な音声形式が利用可能であればそちらをおすすめいたします。
音質が良い場合と悪い場合の文字起こしの比較
音質が良い場合
A:他社では復旧が出来なかった場合も高額な費用が発生すると言われたのですが本当ですか?
B:弊社のデータ復旧サービスは成功報酬となっております。必ず調査後に「見積書」と「復旧可能なデータリスト」を提出いたしますので、データを復旧出来ない場合に高額な作業費を請求することはあり得ません。
A:わかりました、ありがとうございます。
音質が悪い場合
A:他社では●●場合も高額な費用が発生すると言われたのですが本当ですか?
B:弊社のデータ復旧サービスは●●。必ず調査後に「見積書」と「●●なデータリスト」を●●ので、データを復旧出来ない場合に●●することはあり得ません。
A:わかりました、ありがとうございます。
このように同じ内容であっても、音質の違いで文字起こしの精度は大きく変わります。ちょっとした工夫で音質は向上できるので、急な録音ということでなければ本番の録音前に一度試し録音を行って状態を確認しておくことをおすすめします。
情報のご提供
音声データからの文字起こしの場においては、「音」だけを頼りに文章化していきますが、音声データを繰り返し聞き返すだけではなく、一般的ではない用語はインターネット検索など他のツールも活用して作業をすすめていきます。
そのためご依頼の際に、参考資料等もあわせてご提供いただきますと作業精度・効率が向上しやすくなります。
ご提供いただくとより精度が上がる情報
情報提供用の申込用紙の見本
-
発言者の情報
-
発言で出てくる専門用語や略語
簡単な情報でも可
参考資料のご提供が難しい場合でも、そのテーマやジャンル、また出席者の人数や苗字だけのような断片的な情報だけでもご提供いただけると作業するうえで大きな手掛かりになります。
発言者の情報
大人数が参加している会合等の場合は、発言者の特定も難しくなるケースがあります。通常はそれぞれの参加者にA,B,C,D…などの記号で割り当てて対応していますが、特に同年代の出席者が多い場合などはその区別がつかない場合もあります。
会合の始まりの段階部分での発言者とその発言内容の抜粋を記したメモ書きをご提供いただくと文字起こしの精度が上がります。
あるいは単純に、録音を始めた会合の冒頭部分でそれぞれが自己紹介をする、名乗りを入れてもらうというだけでも構いません。
資料のご提供
固有名詞もそうですが、業界特有の専門用語・略語などは、参考資料を事前にいただければ特定が容易になり、文字起こしの精度が向上します。
レジュメなどの配布資料や出席者名簿等がございましたら、提供可能な範囲で構いませんのであわせてお送りください。
情報のご提供がある場合とない場合の比較
ご提供情報
- 脳神経についての話し合い
- 議長1名 参加者3名 合計4名
- 主に参加者の男女1名ずつが話をしています。
- 議長:佐藤、参加者:増岡(女性)、鈴木(男性)、田中(男性、ほぼ発言なし)
情報がある場合
佐藤:増岡さん先週の資料は出来ていますか
増岡:はい出来ています。先週は延髄の一番下の所までになります。
佐藤:わかりました、では順番にお願いします。
増岡:先週の提案ですが確かにいいとは思います。ですが、効果が一時的なのが心配です。
鈴木:他に方法がないんですよね、一時的でも効果があればいいと思っています。
増岡:確かにそうですね、これ以上というのは難しいですね。
田中:そうですね。
情報がない場合
A:マツオカ(00:00:46)さん先週の資料は出来ていますか
B:はい出来ています。先週はA図(01:23:22)の一番下のところまでになります。
A:わかりました、では順番にお願いします。
B:先週の提案ですが確かにいいとは思います。ですが、効果が一時的ではないか心配です。
C:他に方法がないんですよね、一時的でも効果があればいいと思っています。
B:確かにそうですね、これ以上というのは難しいですね。
D:そうですね。
情報のご提供がない場合、話者はA,Bという表記になり、文中に出てくる名前に関しては、カタカナ表記となります。また、人名は似ている名前と聞き分けが難しいことも多いです。話者の数や話し合いのテーマなど、ちょっとした情報があるだけでも大きく変わってきます。
その他
文字起こし箇所の範囲指定
会議や講演会など長時間の文字起こしであっても、開始までに雑談があったり、間に休憩が入ることがあったりすると思います。指定がない場合は、そういう部分も含めて文字起こしをいたしますが、不要であればあらかじめ文字起こしの範囲を指定、あるいは不要部分をお知らせください。指定範囲のみを対象としたお見積りをご案内いたします。
早めのご依頼(納期)
音声の長さが同じでも、納品までのお時間で料金が変動します。音声データが手元にあり早めにご依頼が可能であれば余裕をもったご依頼をお勧めします。手元にない場合でも、無料見積りをお申込みいただければデータアップロード用の専用サーバーを事前にご案内することも可能です。音声の準備ができ次第アップロードしていただければすぐにお見積りのご案内が可能ですので、早めの納品が可能になります。
音声データの品質を上げるための
チェックリスト
以上の点を踏まえて、確認のポイントをまとめた「音声データの品質を上げるためのチェックリスト」をご用意いたしました。
チェックリストを参考に音声データを録音していただければ、文字起こしデータの精度向上だけでなく、文字起こし・テープ起こしにかかるコストの抑制にもつながります。インタビュー、対談、講演、面談、会議などの打ち合わせ、話し合い等において、音声データを録音する際にご活用ください。