目次
■要約
完璧な音声入力は期待できないが、普段の生活では実用性に耐えられるほどの音声入力が期待できる。シンプルな文字入力や文章に対してフリック入力以上のスピードで入力ができる。また、やり方によっては自動書き起こしツールとしてかなり有効な手段として考えられる。使い方を工夫することでかなり生産的な活動ができる。
■なぜ音声入力を必要としているのか
さて、今回、僕自身がなぜ音声入力を必要しているのかと言うと、一時的ではありますが片腕が使えない状態にあるからです。また、僕自身の片腕が使えない状況以外にも必要なシーンの存在、もしくは、情報を必要としている人たちがいると思うので、今回情報をまとめて、発信していくこと自体が価値のあることではないかなと考えました。
■そもそも音声入力とは何なのか
基本的に僕の認識としては、パソコンとかスマホ端末に対して音声入力してテキストでアウトプットするというようなものです。また、パソコンとかスマホ端末の操作を音声でするための入力です。つまり、音声入力というインプットからテキストや操作などの動作をアウトプットしたりします。このようなものは「音声入力ソフト」「音声入力ツール」「音声認識ソフト」「音声書き起こしソフト」等と呼ばれています。
■現状、音声入力にはどのようなメリットデメリットがあるのか
まずは、始めに音声入力全体に対して言及していこうと思います。そこで音声入力は文字入力に対してどのようなメリットデメリットがあるかについて整理をしていきます。
▼音声入力のメリットデメリット
メリット
テキスト入力に比べ音声入力のスピードは速い
入力作業が楽
肩こりや目の疲れが軽減
簡単な文章ならテキスト入力より音声入力の方がミスが少ない
腱鞘炎のリスクが軽減される
音声入力による操作ができる
デメリット
パソコンを使った見直しが必要
思考するのには適していない?
慣れるまでは多少のスイッチコストがかかる
バッテリーが減る
通信料がかかる
他人の迷惑になりやすい
雑音が入ってくると誤認識しやすい
以上が考えられるメリットデメリットになるかと思います。
■音声入力にはどのような方法があるのか
では、音声入力にはどのような方法があるでしょうか?それぞれの方法について確認していきましょう。パソコンにソフトとしてインストールするものとインターネット上のサービスとしてサービスを享受できるものがあります。以下では調査した内容をリストアップしていきます。特に、今回は無料で使えるものをリストアップしています。無料ものをリストアップする理由としてはそもそも有料のものの必要性が感じられないということが挙げられます。もし詳しく知りたい方は以下のリンクを参照するといいでしょう。
https://writer.hateblo.jp/entry/2016/12/01/155944
https://creative-ict.net/archives/1537
https://it-sora.net/archives/4987#1
PC にソフトとしてインストールするもの(有料)
- ドラゴンスピーチなどなど
- Soundflower(無料)
インターネット上のサービスとして享受できるもの(基本無料)
- Google の音声入力ツール
- Speechnotes
- writer-app
■それぞれの音声入力はどのような特徴があるのか
以下では基本的に無料ツールについて言及していこうと思います。
▼Google の音声入力ツール
ここで言うGoogleの音声入力ツールとはGoogleドキュメントなどで音声入力をする方法とスマホでSNSやLINEでのテキスト入力または Google Chrome などでの検索の際に使用する Google の音声入力ツール全般のことを指します。
メリット
- 音声認識精度が高い
- 長文でも対応可能
- 簡単な文章ならテキスト入力(スマホならフリック入力)より音声入力の方がミスが少ない
デメリット
- 他のタブに移るとタイムアウトになる
- 句読点やその他の記号の入力ができない
- 大勢の人がいるところでのコミュニケーションには適していない
※Google、iPhone、その他デバイスでの音声入力ツールの違いについて疑問がある方
基本的には以下のリンクを見ればだいたい解決すると思います。
https://today-is-the-first-day.com/voice-input
▼Speechnotes
メリット
- 句読点や改行が入力できる
- フリック入力よりも早い
- タイムアウトがない
デメリット
- Googleの音声入力ツールに比べ認識率が低い(自分も体感済み)
https://10min.hateblo.jp/entry/2018/02/20/000504
▼writer-app(一部有料)*僕は未使用
メリット
- 他のアプリケーションと組み合わせることで汎用性が高まる
- 「。」を入力することができる
- 改行を自動でしてくれる
- 多言語での文字起こしが可能
デメリット
- 「。」以外の句読点等の記号は入力することができない
*Soundflower省略
▼小まとめ
基本的にそれぞれのツールでメリットデメリットはありますが、組み合わせて使うことによってそれぞれのデメリットを補うことも可能なようです。その点について述べられている記事は以下にありますのでご参照ください。
https://note.mu/yriica/n/n3050888696ab
https://kakuyasuunyou.info/archives/2054
https://today-is-the-first-day.com/voice-input
■音声入力はどのようなシーンで使用することが適しているのか
音声入力にはどのようなシーンが適しているでしょうか?今回のリサーチを通して以下のような状況に適しているように思います。
・動画制作などの文字起こし
・メモ
・簡単な文字入力
・すでに思考済みの文章
・怪我などの障害によってブラインドタッチなどの入力作業ができない状況
・仰向けなどの文字入力がしにくい状況
■まとめ
今回のまとめも、音声入力によって書いた記事です。この経験を通して感じたことは、僕の場合ブラインドタッチするより音声入力の方が早いということです。さらに有用性に関してもこれといった大きな問題は感じません。もしかしたら、今後も環境と人々の世代が変わることで音声入力の比率が高まっていくんじゃないかなとも考えています。
特に、Twitter、Facebook LINEとかの SNS では単純な文章が多いと思うので音声入力の方がかなり効率的に入力できると感じています。私自身もスマホでも音声入力ができるように設定しました。そして、 LINE では完全に音声入力の方が適しているように感じます。他人の目を気にするような状況ではない限り LINE では音声入力をし続けると思います。
音声操作に関しては今後の発展を期待したいと思ってます。 PC の操作にしろ、スマホの操作にしろ、 IoT 機器の操作にしろ単純な命令をする場合は音声の方がよっぽど早く操作できます。複雑な操作や人間側の思考が必要なものに関しては今後も文字などの入力が必要だとは思いますが、シンプルな操作は音声操作に代替されていくのではないかと考えることができます。
PC での入力に関してもアプリや Google ドキュメントを組み合わせることで実用性に耐えられる使い方が可能なような気がします。その点に関しても今後、使いながら探求していきたいと思っています。
他方で、思考をするということに関しても、やり方を工夫することで音声入力でも思考を伴った入力とかができるんじゃないかなと感じています。