わかるLog

初級者のWordPressやサイト作りの困りごとを解決する「わかるWeb」が、感動ストーリーや日々のメッセージを綴ります。

音声入力での文字起こしと言葉の解釈



10月24日(木)

ジョギングなし。


朝4:30から作業。

日中は日常的な作業をして、15:00ぐらいから動画作業に切り替え。


最近、紙の書籍やデジタル以外の素材からの文字起こし(テキストの打ち込み)をする場合、スマホでの音声入力をよく使っている。


例えば、Googleドキュメントに文字起こししたテキストを入力したい場合、スマホでGoogleドキュメントを開き、スマホの一番下のマイクアイコンをタップして、書籍などの内容を読み上げる。

できるだけはっきりとしゃべった方がいい。

すると、音声が文字に変換されてそのまま入力される。


ただ、日本語は一つの発音にいくつもの漢字が該当したり、意味が違ったりするので、PCでその部分を修正する必要はある。

また、音声が不明瞭な場合にも、意図した文字が入力されない場合がある。

 


AIはある程度文脈から該当文字を判断するようなので、意味の分かるセンテンスごとに音声を入力するのが良いようだ。

例えば、「せいかい」と読み上げても、「正解」「政界」「盛会」といくつか解釈が分かれるが、「そのこたえはせいかいだった」と読み上げれば「正解」と出てくるはずだ。


こうしたことはあるにせよ、書籍を写真で撮ってGoolge画像検索機能で文字起こしするなどよりは、数段速いと思う。

とっくにこの機能を使って作業をスピードアップしている人はたくさんいるだろうが、これに限らず、AIが進化を続けている昨今、いろいろ試してみるのは必要だと思う。

 

ではまた明日!