文字起こしとは(文字起こしの歴史)

文字起こしの原点

文字起こしの原点

話し言葉を文章化するという行為は古代ローマ以前にまでさかのぼることができます。 速記の記録はローマ時代以前の大理石の破片などからも見つかっていますが、歴史上に明確に残っている文字起こしの有名な事例としては、紀元前63年の「カティリナ弾劾」演説です。カエサルと同時代に活躍した政治家のキケロが、政敵カティリナのクーデター計画を察知し、それを弾劾する演説を議会でおこなっており、解放奴隷のティロの手によりその内容が記録されています。「Quo usque tandem abutere, Catilina, Patientia(カティリナよ、おまえは我々の忍耐をいかに長いこと浪費したことか)」の出だしは「QPN」という3文字に略されたとされています。この名演説の詳細は現代まで残されており、インターネット上でも閲覧することができます。


速記の発展

ペンと紙しかない時代に話し言葉を完全に文章化するのは難易度が高く、様々な手法が試みられていました。簡略化した符号を使うという”発明”がされたのは16世紀のイギリスにおいてです。それらをさらに発展させ近代速記が確立したのは、1837年に同じくイギリスのピットマンがまとめあげた「表音(記音式)速記法」からとされています。その特徴は話し言葉を英語のスペルではなく発音とおりに符号化するところにありました。英語の音声学的分析から発音を43音に整理し、母音と子音に分け対応する符号を極端にまで簡略化、体系的に整備しました。この”音”を単純な符号で記述するという手法が現代速記のベースとなっています。


日本での速記

日本での速記

日本で近代速記の概念が導入されたのは19世紀になってからです。16世紀のイギリスで速記は「Stenography」という造語で定義されましたが、日本では1866年に出版の英和辞書で「早書キヲスル術」と訳されています。
日本の近代速記の父とされるのが田鎖綱紀で、職場で外国人が使う速記文字に感銘を受け、独学で10年以上研鑽を重ねて日本語にあわせた速記を考案、1882年に「日本傍聴記録法」を発表しています。東京で開催された速記の講習会が10月28日だったので後年にこの日が速記記念日として制定されました。
その講習を受けた弟子たちにより、速記は改良が重ねられ実用化されていきます。
当初は新聞社にて、演説会や討論会の内容を記事化する際に利用されたようですが、それ以外にも落語や小説の口述筆記にも利用されます。速記で記された講談落語「怪談牡丹灯篭」や小説「経国美談」が人気を博しました。また話し言葉をそのまま文章にするということは文学界にも大きな影響をあたえ、のちに言文一致運動へとつながっていきます。
日本語で「速記」という造語が使われだしたのもこの時代になります。

また明治以降の諸制度は欧米を真似て整えられてきたわけですが、議会制度の一つとして速記で議事録を残すというのもその一つでした。日本の速記が公式の記録方法として実用に耐えうるものなのかの検証が重ねられ、紆余曲折はあったようですが、1890年の第一回帝国議会から速記が採用されることになります。国会の完全な議事録を最初から記録していたのは先進国の中では日本だけです。


新しい技術と速記の活用

新しい技術と速記の活用

日本で東京・大阪間で長距離電話が開通したときには、電話速記という新たな職が生まれました。特に速報性を求められるニュースは当初は電報で送りあっていたのですが、電話で直接聞き取りながら速記で記録すると効率が良いことに気づき、電送写真やFAXの原型であるテレタイプなどが出現するまでの短い期間でしたが、新聞や通信社に速記者が大勢雇われることになります。他に1925年に始まったラジオ放送も、これも録音機が実用化されるまでのわずか数年の間ですが速記者が記録を残していました。
このような新しい技術開発によって文字起こしは新しい展開を迎えることになります。


録音機の登場

録音機の登場

1877年にエジソンが発明したレコードにより、ついに音を直接保存することが可能になります。当初のレコードは録音も容易な蝋管方式で、アメリカ議会でも議事録記録用に試験的に試されたりもしていたようです。しかし録音時間や回数上限も少なかったため、本格的に活用されるようになるのは機材がより発展した1920年代からです。タイプライターと組み合わせた口述筆記の事務用の録音機が販売され、国会や裁判だけでなく、ビジネス用途にも活用されるようになりました。
録音機と併用することで、訓練を受けた専門の速記者でなくとも、正確な文字起こしができるようになっていきます。

録音機の登場

その後レコードは磁気テープにとってかわられ、1963年にはカセットテープとして携帯できるまでコンパクトになると録音技術は一般にも広まるようになります。またワープロからパソコンへの発展により、記録した文章を印刷するまでの時間も格段に短縮していくことになります。


テープ起こしと反訳

テープ起こしと反訳

音声を文字化することを本記では「文字起こし」と表現していますが、歴史を振り返ってみると、「テープ起こし」や「音声反訳」などの表現のほうが一般的でした。
「テープ起こし」とはその名の通り、テープに録音した音声をもとに文字化することを指します。職業や業務として一般化しはじめた時代ではまだテープが主流だったためこの呼称が広まりましたが、現代はICレコーダーやビデオカメラなどを利用したデジタル録音・録画データからの文字化が主流になっており、現状にはそぐわない表現になっています。

また「反訳」についても、本来は速記時に記した符号を通常の文字に置き換えること示す言葉でした。例えば速記の熟練者が会議の内容を符号で速記して、見習いがそれを「反訳」するというような表現です。しかし速記専用のタイプライターやその自動反訳ソフトなどが利用されるようになると、この区分もなくなってきたため、録音された音声を文章化する作業自体を「反訳」として表現するようになっています。


現代の文字起こしの需要

現代の文字起こしの需要

録音・再生技術の発展と、文書の作成ソフトや印刷技術の進化により、国会や裁判所での手書きによる速記も徐々に縮小されていっています。かつては速記者が取り合いになっていた時代もあったため、日本では伝統的に国会や裁判所において速記者を内部で養成する機関をもっていました。しかし、現在では速記者の養成、新規採用ともに完全に廃止されています。
ただし文字にして記録を残すという業務そのものが不要になったわけではなく、あくまでも音声をその場で文字化しておくという必然性がなくなっただけで、文字起こしとしての要望は現代でも多種多様にあります。

現代の文字起こしの需要

各省庁・地方自治体・行政法人などからマスコミ関係や司法関係などまで、会議、講演・フォーラムやセミナー、式典や会見、座談会やインタビューなどもありますし、スマートフォンやICレコーダーが一般化したこともあり、個人の方からでもトラブルの際のやりとりを文字起こししたいという要望が非常に増えています。


裁判で利用される文字起こし

裁判で利用される文字起こし

裁判やあるいはその前段階での、警察や弁護士などへの相談の際に、音声データを証拠として提出する事例が増えているようです。しかしほとんどのケースで、音声データと同時にその内容を文書化した「反訳書」を提出されることを要請されます。
監視カメラ等の映像の場合だと、早回ししたり飛ばしたりして、事件の瞬間やその前後の該当部分だけを検証するということは容易なのですが、音声でのやり取りの場合ではそういった手法が使えず、会話の概要を確認するにはだけでも時間がかかるため、証拠として音声データが提出されていても実際には文書化された内容が検証されることになります。
そのため「反訳書」が要請される場合は、正しい文字起こしのやり方を把握している当社(データグリーン)などの文字起こし、テープ起こしの音声反訳専門業者に依頼されるケースが増加しています。


新しい文字起こし

新しい文字起こし

近年になってコンピューターを用いた自動文字起こしも試されるようになりました。ソフトウェアで音声認識を自動で行えるようなったのは1990年代末ごろからで、当初はあくまでも聞き取りが何とか可能という程度のものでした。しかし2010年代から活発になったディープランニング研究とビッグデータの活用により、AI技術が急速に進化します。音声認識精度も飛躍的に向上し、iPhoneの「Siri(シリ)」やAmazonの「Alexa(アレクサ)」のように音声によるコンピューター操作も商用レベルで可能になりました。
ただし音声入力と、文字起こしはまた違うものです。
同じ時期に「YouTube」でも動画内の音声を自動で字幕化するサービスが開始されましたが、実用性という意味では低い評価で、部分的に正しく認識されることはあっても、あちこちで空耳状態の非常におかしな日本語が表示されるといった具合でした。

ただこれも最初の時期だけで2020年の時点では、話者が一人・周囲が静か(ノイズが入らない)・発音が明確などの条件が整っているという条件が付きで、多少の手直しが必要なレベルの正しい文字起こしが可能になっています。そして2018年頃からはAmazon(AWS)、Google、MicrosoftでAIを使った自動文字起こしサービスも開始されています。


テレビでの字幕放送

テレビでの字幕放送

生放送番組における字幕(テロップ)についても、AI対応が進んでいます。
特に災害時の緊急放送などは字幕化の要望が非常に高いもので、従来は複数人がリレー方式でリアルタイム入力を繋げていく方法や、台本を活用して事前にできるだけ準備をするなど人手を多数使うものが主流でした。自動音声認識のシステムが使われる場合でも、音だけ別取りする必要があることもあれば、コンピューターに認識されやすいアナウンサーの発声部分だけ自動化するなど部分的な活用まででした。
番組音声をそのまま使っての自動文字起こしが実用されだしたのは2018年頃からになります。まだ実験的なところもありますが、インターネット放送やCS放送などのニュース番組では自動音声認識システムを使った字幕放送がすでに行われています。


文字起こしと国語力

文字起こしと国語力

文字起こしをする際には様々なスキルが要求されます。
例えば業界特有の専門用語や言い回し、略称などが飛び交う場でもスムーズに文字起こしするには、まずは広範な知識が必要になります。音声が聞き取りにくい場合はその場で調べなおすこともよくありますが、まったく知識にない単語では検索するだけで一苦労します。
また話し言葉というのは、文章化してじっくりと確認してみると、日本語の文章としては順番や構成がおかしかったりすることもあります。
整文をする際には、それを自然で正しい意味の通じる日本語に修正する必要がありますが、専門用語などが混ざってくると難易度も非常にあがります。状況に応じた柔軟な対応が求められますが、根底には文章力や語彙力などといった国語力が必要です。


録音機器を用いる際の注意事項

ICレコーダー等の録音機器は、大原則として話者に近い位置に設置します。複数で話をするときは全員の距離が同じになる中間位置に置くのがいいです。音量に差が出来てしまうと、とても聞き取りにくい音声になります。そのため人数が多い時は録音機器を複数用意して、それぞれの中間位置に設置すると音量の差も均一になり聞き取りやすい音声になります。

録音機器を用いる際の注意事項

また録音は静かな場所で行いましょう。夏場に窓を開けたで部屋で説明会を行ったところ、外の蝉の音を録音機器が拾いすぎて、後から録音を確認しても発言内容が殆ど聞き取れなかった、しかし出席中には蝉の声は殆ど気にならなかったというようなことがありました。これは聴覚が備える「カクテルパーティー効果」と呼ばれる現象が原因です。簡単にまとめると、集中していればある程度の雑音は気にならなくなるという現象のことで、雑音だらけのパーティー会場でもなぜか特定の人との会話は聞き取れてしまうということが名称のきっかけになっています。

同様に録音機器を設置する位置によっては、ペン書きの音や紙をめくる音が大きく入ることがあります。これが発言と被ると聞き取りにくい原因となります。その場では気にならない程度のノイズでも、録音には大きな影響を与えることがあるので注意しましょう。

音声・動画データの文字起こしが必要な時

データグリーンならAIによる音声データの解析技術と熟練ライターの豊富な経験・ノウハウを組み合わせた「精度の高い文字起こし、テープ起こし」をご提供できます。音質が悪いデータや長時間の文字起こしにも低価格、年中無休で対応しておりますので、週末のご依頼でも土日や祝日の納品が可能です。また、プライバシーマークおよび情報セキュリティマネジメントシステムの国際規格「ISO27001(ISMS)」の認証も取得しておりますので、秘匿性、機密性の高い音声・動画データの反訳作業(文字起こし、テープ起こし)もおまかせください。

お電話からお問い合わせ

0570-550-729

年中無休

平日
9時〜18時
土日祝
9時〜13時

※年末年始、GW、お盆期間は休業

Webからの
お問い合わせ・無料お見積り

広告ムービー