さまざまな場面で必要な文字起こし作業
皆さんは、音声データの文字起こしをされたことがあるでしょうか。文字起こしが必要な場面というのは、会議の議事録作成、電話やり取りの記録、インタビュー内容のテキスト化、動画の字幕作成など幅広いので、経験されたことのある方も多いのではないでしょうか。
文字起こしが必要になる理由
音声データを文字起こししてテキスト化することには多くの利点があります。例えば、メールやWebページといった媒体で共有しやすくなる、データサイズが小さいので記録しやすくなる、音声を聞くよりも短時間で内容を確認することができるようになる、簡単に検索できるようになるなどです。
文字起こし作業にかかる膨大な労力
しかしながら、文字起こし作業には大変な労力がかかります。仮に再生時間が1時間の音声データを文字起こしようとした場合、一般に3~6時間もの時間が必要となります。録音の品質が悪く何度も聞き直さないといけないような音声や、複数の話者が交互に絶えず喋っているような音声の場合は、さらに時間が必要であることもめずらしくありません。また、時間がかかるだけでなく、聞き漏らしがないよう集中して音声を聞き続けるというのは、精神的になかなか疲れるものです。
文字起こし作業支援ツールの開発
そこで、DX研究開発事業部では、この文字起こし作業の労力を軽減するツールの開発に取り組んでいます。
開発中のツールは、音声・動画ファイル、またはマイクから直接入力された音声から、音声認識技術を利用して自動で文字を起こし、その結果をスムーズに確認・修正できるようにすることを目指しています。現時点(2020/11/2)で以下のような特徴を有しています。
使いやすいツールを目指して
今後も、自動文字起こしの確認・修正作業に掛かる労力をいかに減らすか、文字起こし結果をいかに活用しやすくするかに焦点を当て、ツールの開発を進めてまいります。次回以降は、その取り組みについても少しずつご紹介していきたいと思います。
Comments