文字起こし用語集


あ行

相槌(相づち/あいづち)

会話中の「はい」「うん」「へえ」「ええ」など、相手の話に調子を合わせた短い発語のことを指します。文字起こしでは、特に意味をなさない"ケバ"として処理されることがほとんどですが、参加者の少ないインタビューなどで相づちをすべて除外すると、一人の話し手が延々と話し続けているだけになるので、バランスも考慮する必要があります。

言い間違い

会話中の言い間違いなども含めて文章にすると、読みにくい文章になります。文字起こしでは読みやすい文章にする為に言い間違いを削除したり訂正したりする場合もあれば、その場の雰囲気を残すために、あえてそのまま正確に残す場合もあります。

言い淀み/フィラー

言葉がすらすらと出ずに滞る際に言い淀むと「あのー」「えーと」などの意味をなさない発言が言葉と言葉の間に出ることがあります。英語ではフィラー(filler)と言い「um」「ah」「so」など。パブリックな場では弱さや躊躇いを表すものとして使わない方がよいという指摘もありますが、誠実さ・純粋さの表れとして評価される場合もあります。
"言い間違い"と同じく文章の判読性に影響を与えますが、口調やその場の雰囲気も表すことがあるため、通常は"素起こし"では敢えて残され、"ケバ取り"ではカットされます。

インタビュアー/インタビュイー

インタビューをする人はインタビュアー(interviewer)ですが、インタビューをされる人にも呼び名があり、インタビュイー(interviewee)となります。こちらは一般にはあまり馴染みがない言葉かもしれません。インタビュアーは職業として独立して活動できますが、インタビュイーは職業にはならずその場での役割にしか過ぎないためでしょう。

映像データ

音声データだけでなく、映像データからの依頼を受けることも多くあります。"話者識別"の参考に提供を受けることもあります。ビデオカメラで撮られた映像以外に、最近はオンライン会議の映像データなどもあり、一般的な拡張子の映像データであればほぼ全て対応可能です。拡張子はMTS、MP4、MOV、3GP、WMV、AVI、MPG など。

音声データ

"ICレコーダー"やスマートフォンで録音した声のデータ。録音機器により様々な種類のフォーマットが存在します。メーカー独自の規格もあるため映像より種類は多いです。 拡張子はWAV、MP3、WMA、AAC、M4A、FLAC など。

音割れ

音の波形が潰れることにより、不快な"ノイズ"音が発生する現象のこと。一般的には再生時にボリュームを上げすぎた時、スピーカーやヘッドホンの許容を超えた場合に発生します。録音時にもマイクの性能限界よりも音が大きすぎると、音割れした状態で録音されることがあり、音割れ防止機能などが付属している機種もあります。


か行

外来語

外国の言語からの借用語のこと。大体はカタカナで表記されますが、入ってきた時代や、文化への浸透度、漢字化したのかどうかなどで、外来語扱いになることもあれば、ならない言葉もあるのでその境界は曖昧です。
例えば次のものは全て借用語ですが、外来語扱いはされていない言葉になります。
馬、梅、玄関、鳥居、メンツ、ワンタン、ラッコ、トナカイ、パン、ガラス、画廊、簿記、タバコ、イクラ、カルタ など。
文字起こしにおいては、専門用語で英単語などがそのまま出てくる場合はカタカナ表記で書き起こしされます。有名な英語の格言や引用であれば英語表記になる場合もあります。

例)To Be or Not to Be(生きるべきか死ぬべきか)

カクテルパーティー効果

パーティーの様なたくさんの人が雑談している場でも、自分の興味のある人の会話や自分の名前などはきちんと聞き取れる現象のこと。人間の脳は便利にできており、入る情報の全てを聞き分けているとその処理に脳が追い付かなくなるので、選択と集中が無意識のうちに行われています。
そのためその場では聞き取れていた会話でも、後から録音を聞き直すとノイズだらけで殆ど聞き取れなかったということもよくあるので、雑音が多い場での録音の際は一度その場での聞き直しテストをすることをおすすめします。

間投詞

品詞の一つで、感嘆詞・感動詞とも呼ばれます。「ああ」「おお」「はいはい」など話し手の驚きなどの感情を表す時に使用されます。文字起こしでは、特に意味をなさない"ケバ"として処理されることがほとんどです。

聞き取り不明/不鮮明

マイクで音が拾えていなかった、"ノイズ"が重なっていたなどで、文字起こし作業者がどうしても発言内容が聞き取れない部分が出る場合があります。
聞き取り内容が不明/不鮮明な場合、聞き取りができない単語に関しては、●で表記し、”タイムコード”も追記します。聞き取りはある程度できても全体的には不鮮明な箇所に関しては色をつけて該当箇所を色塗りし、また特定ができない単語に関してはカタカナ表記をして”タイムコード”を記載しています。

記者ハンドブック

各報道機関が発行している自社内の出版物の表記ルールをまとめたもの。文章を書く際の細かな注意事項が掲載されており、迷いそうになる送り仮名や同音異義語の使い分けや慣用句の使い方などが例示されています。記者やライターなど文章書きには必須の書で、文字起こしにおいても表現・表記の統一用の指標の一つとしてよく利用されています。

例)お菓子と御菓子→お菓子が正解(接頭語、接尾語は原則として平仮名)

他にも「訓読みの副詞は平仮名」「擬態語は片仮名」などのルールが明示されています。

くだけた言い回し

親しみやすい雰囲気がある言い回しで、日常的な言葉を用いた表現です。会話の雰囲気を残す場合はそのままで、資料としての文章作成であれば修正を行います。

例)どっか→どこか

口癖

発言の際に無意識で付けていることが多く、発言者も自覚があまりないことが多いです。意味をなさない言葉ですが起こし方によってはあえて残すことがあります。

例)語尾にですねを付ける。あのですね。それでですね。
語尾を伸ばす。あのー、だからー

敬体

整文の際に使用する起こし方の一つで、発言を「です・ます」調に整えます。丁寧な文章にするのに向いている起こし方で、会議のデータを敬体で整文すれば口調も統一され読みやすい資料になります。

ケバ/ケバ取り

「あのー」や「えーと」などそれ自体は意味の無い発言の事。広い意味ではさらに言い淀み、言い間違いや口癖、重複表現なども含まれます。会話の中には無意識のうちにこのケバがたくさん出てきますが、通常は意味をなさない部分なので、カットしても文章としての意味は損なわれず、且つすっきりとした読みやすい文章が出来上がります。

校正

文字や文章を比較して、誤字脱字などのミスを修正すること。文字起こしでは、誤字脱字のチェックだけでなく、聞き間違いや聞き漏れがないか音声を聞き直しながら修正を行う作業も含まれます。

校閲

校正よりもより厳密なチェック。一般的な出版物の場合には表現ゆれの統一だけでなく、ファクトチェック、法令違反、差別表現などの不適切表現の有無までチェックされます。文字起こしに際しては表現ゆれの統一ぐらいまでとなります。


さ行

自動字幕起こし

YouTubeのオプション機能の一つで、映像に自動で字幕を追加するサービス。AIによる自動生成のためその性能には非常にばらつきがあります。

終助詞

助詞の一つで、主に文末で疑問・禁止・感動・念押しなどの意を添える助詞。「ね」「よ」「な」など、読みやすいように削除して文字起こしをする事もあります。

例)○○ですね→○○です

重言/重複表現

一文内で同じ意味を繰り返していること。会話では気づかないうちに使ってしまうことがよくあります。有名な重言としては「馬から落馬」「頭痛が痛い」。
読みにくい文章になるので"ケバ"として扱われることがあります。

例)写真の撮影は、許可を取って撮影してください。→写真は、許可を取って撮影してください。

常体

整文の際に使用する起こし方の一つで発言を「だ・である」調に整えます。相手に発言の内容のみを伝えるのに適しており、特に講演会・セミナーなどの一方通行式の文字起こしに向いています。

常用漢字

一般の社会生活において、現代の国語を書き表す場合の漢字使用の目安として定められた漢字です。日本の学習指導要領では、義務教育の国語で習う漢字は常用漢字のみと規定しています。常用外の漢字の場合、音読みは読み仮名を添えて記載、訓読みはひらがなで記載するルールが主流です。

例)音読み:楕円→楕円(だえん) 訓読み:穿つ→うがつ

助詞

単語に付加し自立語同士の関係を表したり、対象を表したりする語句の総称で俗に「てにをは」と呼ばれています。文字起こしでは助詞の言い間違えや、抜けることがよくあるので補完・修正をするケースが多々あります。

素起こし/逐語起こし

発言の内容をそのまますべて文字に書き起こす起こし方。言い直しや言い間違い、「えー」「あのー」などのフィラーワードもそのまま書き起こすので、内容の正確性が重要な場合、会話の雰囲気、発言者の特徴なども確かめたいときに最適です。

整文

ただ音声を文字に起こすのではなく、言い回しや語尾を整え、口癖なども修正します。"ケバ取り"より読みやすさを重視した起こし方となります。資料作成や会議の議事録など内容を理解するのに最適です。 作成する文章にあわせて「です・ます調」や「で・ある調」など起こし方になります。

司会進行

“Web会議/オンライン会議"においては、発言の被りや見合ったりするケースがよく発生します。顔合わせしながらの会議では、参加者同士で空気を読みあうことや、アイコンタクトをすることで司会の誘導がなくても上手に回されていることがよくありますが、オンラインの場合は司会が積極的に進行をする必要があります。

騒音/ノイズ

騒音とは車の走る音や風が吹く音など不快で好ましくない音の事をさしますが、録音された音声データではカフェで流れるBGMや紙をめくる音だけでも聞き取りの妨げになります。このノイズの程度によって文字起こしの難易度や精度が大きく変わります。


た行

タイムコード

映像や音声の時間を現したメタ情報のことをさします。映像の編集作業の際にタイムコード情報を参考に音声を同期させ、あるいは字幕を挿入させます。文字起こしでは、目印になるように5分間隔で挿入し、また音声が聞き取れないところや"不鮮明"箇所にも挿入して確認がしやすいようにしています。

同音異義語

発音は同じでも意味が異なってくる単語のこと。文字起こしでは音声情報のみで文章を作成するので、同音異義語でひっかかることはよくあります。前後の文脈からあてはめることもあれば、難しい場合はカタカナで表記をして"不鮮明"箇所として取り扱います。

倒置表現

会話の中では動詞や形容詞の位置が逆になるなどの倒置発言が意外に多く出てきます。通常の文章においては、特定の単語や意味合いを強調する意図で稀に使用されることがありますが、会話においては考えながらしゃべるというところから、言い直しや補正的な意味で使用されることがよくあるためです。すべての倒置発言を文章にすると読みにくくなるので、順番を戻して文字起こしを行うことがあります。

データ復旧

音声や動画データを保存したPC、外付けHDD、SD /microSDカード、 USB メモリが認識しなくなったなど、デジタル記録メディアに障害やトラブルが発生した場合でも、「データレスキューセンター」で音声や動画データを復旧した後に文字起こしを行うことが可能です。

テープ起こし

文字起こしのこと。カセットテープから文字起こしをしていた時代の呼び名になりますが、現代でも現役の言葉です。例えば求人サイトなどでは「テープ起こし(文字起こし)ライター募集」というような表現をあちこちで見かけます。その他、「書き起こし」「反訳」なども文字起こし、テープ起こしと同じ意味で使われます。

テロップ

元々は「字幕合成に用いられる静止画表示装置」自体の呼称でしたが、現在では字幕表示技術やその字幕自体を指す言葉として用いられています。テレビ番組や配信動画のテロップ用の文字起こしを行うこともよくあります。


な行

名乗り

文字起こしを行う場合、音声の情報のみで文章を作成するので、"話者"が多い会議などでは誰が誰か判別が難しくなりがちです。そのため、発言の前には名前を名乗って発言を行う事で区別がつきやすくなります。ちょっとした工夫を行うだけで文字起こしの難易度が下がることがよくあります。


は行

反訳

元々は速記文字を普通の文字に戻す作業のことで、速記文字の翻訳という意味で使われていました。反訳作業の機械化・自動化が進むことで作業自体が簡略化されるようになると意味合いが変化するようになり、現在では文字起こしのこと自体やサービス全体を表す意味になっています。

反訳者

文字起こしをする人、テープ起こしライターなどと同じ意味です。後述のとおり、公的機関で使われやすい単語になります。

反訳書/反訳文書

訴訟の際などに証拠品として、音声の内容を文章に文字起こした書類を一緒に提出することがあります。その書類のことを民事訴訟規則144条・147条・149条では反訳した文書、反訳文書、反訳した書面と表現されています。
そのため裁判などの公的な場所で使用する場合においては、文字起こしした書面のことは従来の意味通り「反訳書」「反訳文書」と呼ばれています。

表記ゆれ

同じ言葉が2通り以上の異なる書き方をされていること。原稿内で表記ゆれが多いと、非常に読みにくくなるので事前にルールを決めて統一する必要があります。

例)送り仮名:受け付け/受付
漢字やかな:りんご、リンゴ、林檎
外来語での長音符:コンピューター、コンピュータ


ま行

文字起こし証明書

裁判法廷用の文字起こしでは、第三者が客観的に文字起こしを行った事を証明する必要があります。データグリーンでは、裁判法廷用の文字起こしをご希望の場合は、文字起こしデータの納品時に証明書をお付けして納品いたします。


や行

約物

句読点・疑問符・括弧・アクセントなどの記述記号の総称。由来は活版印刷からで「しめくくるもの」の意味になります。一般的には厳密な使い方が定義されていない部分が多いので表記ゆれの原因になりやすく、使用の際には注意が必要になります。


ら行

ら抜き言葉

言葉のみだれの代表的な表現の一つ。正しい文法としては「ら」を入れるべきところに「ら」が入っていない表現のこと。実は「ら」抜きの方が可読性は高くなることがあるため、実際の使用上は、「ら」抜きを使う人の方が多いとされていますが、国語教育の現場ではまだ正しい表現とは認められていません。
他にも「い」抜き言葉や「さ」入れ言葉なども、発言だとつい言ってしまう言葉ですが、文字起こしの際は読みにくくなるので修正を行うことがあります。

例)見れない→見られない、持ってる→持っている 働かさせてください→働かせてください


わ行

ワード

ワープロアプリケーション、Microsoft Wordのこと。最低限の書式の機能がついており、国内であれば誰もが標準的に所有しているというところから、データで原稿をやり取りする際に業界標準的に使われています。

話者

話し手のこと。文字起こしでは話し手の特定も必要なため、発言者のことを話者としてカウントします。名前がわからない場合はA,Bのような記号で、わかる場合は漢字もしくはカタカナで名前を表記されます。

例)A:こんにちは
B:さようなら
スズキ:行ってらっしゃい
佐藤:ただいま

話者識別

各発言者の名前まで特定して文字起こしをすること。会議の際などには案外名指しで呼ばれることが少ないため、資料がないと誰の発言か分からないことが多くあります。話者識別がご希望の場合は精度もあがりますので、参考資料も併せてお送りください。

笑い声

文字起こしの場合、会話中の笑い声についても記載はされますが、細かい書き分けまではされません。「ははは」「うふふ」「あっはは」ぐらいまでになり、(苦笑)や(爆笑)などまで表記されることはありません。明石家さんまさんの笑い声でしたら、「ヒャー」と表記されるかもしれません。


A-Z

AI文字起こし

音声データからAIを使って自動で文字起こしを行うこと。人力と比較して圧倒的短時間で文章を作成できますが、話者が一人・周囲が静か・発音が明確などの好条件が揃わないと精度は大幅に下がります。現代技術でもAIだけでは十分な文字起こしはまだ難しい状況です。

DCB(DirectCloud-BOX)

クラウド上のストレージ共有サービス。強力なセキュリティーで情報を守り、ネットワーク上の共有で高い利便性を実現しているため、社内でのデータの共有だけでなく、取引先と安全にデータのやり取りが可能です。

ICレコーダー/ボイスレコーダー

音声を録音するためのマイクを内蔵した小型の電子機器。ポケットにも入るサイズの為、持ち運びにも便利で、急に録音が必要となった時でもすぐに対応が可能です。音質や録音時間、本体のサイズなど用途に合わせてさまざまな種類が発売されています。

Web会議/オンライン会議

在宅勤務、リモートワークが増えたことに伴い、会議もオンライン上で行われる機会が増えてきました。Zoomなどの専用ソフトを使うことで離れた相手と会議を行うことが可能です。

お電話からお問い合わせ

0570-550-729

年中無休9〜夜18

(土日祝日も営業)※GW、年末年始は休業

Webからの
お問い合わせ・無料お見積り