特殊フォーマットへの対応
文字起こしには「ケバ取り」「素起こし」「整文」と複数の起こし方がありますが、もっとこういう起こし方をして欲しいなど、使用用途に応じて細かく指定したい時があります。ちょっと用途には物足りない、あるいは冗長な場合など、場合によっては、文字起こしをしたデータを元に資料用に編集しなおすなどの追加作業が発生することもあるのではないでしょうか。
弊社ではそのようなお客様のご要望に合わせて、通常の起こし方以外に細かな部分まで用途に合わせて文字起こしを行う特殊フォーマットへの対応も行っておりますので、お気軽にご相談ください。
特殊フォーマットとは
文字起こしには、相槌(あいづち)や沈黙、重なり合った音声など、間接的なニュアンスなども含めて起こす方式から、言いよどみや言い間違いなど不要な部分はできるだけカットして内容が把握できる程度までまとめるなど、さまざまな起こし方があり、一般的には「ケバ取り」「素起こし」「整文」の3パターンでまとめられます。
ただしある程度カットしてまとめる「ケバ取り」でも、その場の雰囲気は残したいので相槌部分は正確に起こしてほしいという場合や、そのまま起こす「素起こし」でも言い間違いなどは起こさないで欲しいなど使用用途によっては起こし方に対しての微妙な要望が出てくる場合があります。
また例えばAI学習用のデータやテロップ用途の場合では、文頭や単語にタグを追加する必要があるなど通常の文字起こしにはない別の作業が必要になる場合があります。
特殊フォーマットへの対応とは、このように起こし方に特定のルールがある場合に、お客様のご要望に合わせて文字起こしを行います。
特殊フォーマット例
-
沈黙や笑いなどを表記する
会話の中での、沈黙や笑い声など通常の文字起こしでは起こされない表現を (沈黙) や (笑い) などのように表記します。(沈黙3秒)など秒数表記の対応も可能です。
起こし方サンプル
A:では改めてになりますが、ベーカリーをオープンされたきっかけを教えてください。
B:はい、えーっと(沈黙2秒)改まっていうのって緊張しますね。
A:ははは(笑い)、落ち着いてから話し始めていただいて構いません。 -
会話毎にタイムコードを表記する
弊社の文字起こしでは約5分間隔でタイムコードを挿入していますが、会話毎にタイムコードが必要などといった場合でも対応可能です。
起こし方サンプル
[00:01:30-00:01:34]A:今日はですね、まずですね、起業されたきっかけをお話していただけますか?
[00:01:35-00:01:42]B:えっと、そうですね、いろいろ話すと長くなるんですよね。
[00:01:43-00:01:46]A:では、一番のきっかけとかってありますか?
[00:01:47-00:01:53]B:あー、それは子供ですね、結婚して子供が生まれて変わったことですね、生活とか。 -
納品ファイルを指定する
通常、文字起こししたデータはWordファイルにて納品しておりますが、Excelファイルやテキストファイルなど、お客様がご希望のファイル形式に柔軟に対応いたします。
エクセルの場合は、例2.のような書式を、タイムコード、話者、文字起こしデータでカラム毎に分けて納品することも可能です。Excel形式での納品例
-
特定の言葉を別の言葉に置き換える
インタビューの文字起こしなどでプライバシー保護のため個人や会社名などを特定してしまう固有名詞(人名や会社名など)を匿名化のため〇〇などの別表記に置き換えます。
起こし方サンプル
A:それではインタビューを開始させていただきます。〇〇様、よろしく お願いいたします。
B:はい、よろしくお願いします。
A:〇〇様は、どちらの病院に通院されていましたか?
B:〇〇区の〇〇病院に通っていました。 -
発表用の資料や動画の内容あわせて改ページを行う
講演会や発表会などの資料(パワーポイント等)のページや動画内の発表者の切り替わりなどに合わせて、文字起こしデータの改ページを行います。
また、音声の中で「ここ」や「こちら」などの資料のページを指定されている言葉に実際の資料のページ番号を追加し文字起こしすることも対応可能です。起こし方サンプル
A:ありがとうございます。まだまだお聞きしたいのですが、時間が参りましたので、これで次に移らせていただきます。ありがとうございました。
B:ありがとうございました。
---------------------改ページ---------------------
A:では次の演題に移りたいと思います。●●大学のC先生、よろしくお願いします。
C:よろしくお願いします。まずここ(資料1P)に載せていますが… -
表紙や目次を作成する
研究会や講演会などの文字起こしで表紙や目次などが必要な場合、お客様からのご指定にそった表紙および目次の作成も対応可能です。参考資料や動画データなどから講演者名や講演タイトル、各講演者のページ番号などをまとめて目次を作成いたします。
サンプル画像
-
タグを追加する
音量や音の種類などの音そのもの、あるいは音声が示す意味などにタグ付けを行います。
「あのー」や「えーっと」などのようなフィラーにタグを追加したい場合や、自動車のクラクション、ガラスの割れる音など発話以外の音についてのタグ付けも可能です。起こし方サンプル
文字起こしデータに日本語話し言葉コーパス(CSJ)のタグを追加する。
(F):フィラー
(D):断片化、言い直し
(L):ささやき声や独り言などA:小さい頃からはパン作りに興味があったんですか?
B:(F えー)(L ナンダッケ)興味が出たのは調理学校に行き始めてからです。(D そ)その時の先生から「あなた、もしかしたら製パンが向いてるんじゃない」って言われたんです。
A:そうなんですね。
B:(D ま)まあちょっとやってみたら、これがなんか面白かったんですよね。
上記の例でご案内した書式以外でも、ご指定のフォーマットや仕様がございましたら、お問い合わせの際やお見積りのご依頼時にご教示ください。起こし方や、タイムコードの挿入、タグ付けなど、お客様がご希望されるフォーマットに柔軟に対応いたします。
料金・納期について
特殊フォーマットでの文字起こしは、お客様がご希望される仕様やフォーマットによって料金と納期が変動いたします。データグリーンの文字起こし、テープ起こしサービスは年中無休(年末年始、GW、お盆期間を除く)で土日祝日も営業しておりますので、お気軽にお問い合わせいただくか、無料見積りをご依頼ください。