Tell me, Watson

自己満ライフログの垂れ流し

音声テキスト化技術の効率的活用

はじめに

  • 情報発信が容易になった昨今は,1億総モノ書きの時代だ。
  • 家族や恋人,友人への近況報告といった日常レベルでのメッセージのやりとりから,ブログ寄稿,レポートや企画書の作成,果ては論文や小説の執筆まで,情報伝達における文字情報の役割はあまりにも大きい。
  • ブログを始めてから私も,暇さえあれば「ネタ無いかなー」とアウトプット前提の物の考え方をしていたりする。
  • AIの発達(学習機能)により,音声認識が実用レベルにまで達して久しいが,これがこのテキスト入力を凄まじく効率化する。これについて思うところをまとめてみる。じつはこの文章は,思いつくがまま一人でスマホに向かって喋ってテキスト化された文章をもとにまとめられたものだったりする。さすがに構成や成形はPC等をつかわないとやりにくいけどね。

「モノ書き」のジレンマ

  1. テキスト化したい情報が,リアルタイムで,常に生じている。
    • 何か表現したいことを見つけたとして,情報端末を取り出して,フリック入力ないしタイプ入力して,変換して,記録する,のは煩わしい。
    • たとえば運転中だったり,眠りにつく場面だったり,インスピレーションは突然現れたりするが,そのときに情報端末を取り出して,フリック入力ないしタイプ入力して,変換して,記録する,のは煩わしい,というかできない。
  2. すぐに発信したいわけではない。ただ,ネタは成形が容易な形で残しておきたい。
    • メモは楽だけど紛失リスクがあるし,手書きを発信可能なデータの形にするのはめんどい。
    • ボイスレコードは手軽だけど,結局これも手書きを発信可能なデータの形にするのはめんどい。

つまり,インスピレーションにふれたとき,これをスピーディーに記録し,成形できる形にしたいということです。特にドライブ中とか,安全運転を実現するためにも,ある程度の「遊び」は必要だったりするし,その他の場面でも,「口と耳と頭」は自由であることが意外とあったりする。

というわけで

  • 真剣に音声入力+テキストデータ化が容易な手段を探してみた。
  • Google Documentは音声入力に対応していて,かつ精度が非常に高いけれど,スマートフォンで起動すると一定時間の経過後にタイム・アウトしてしまい,長時間のアウトプットには向かない。というか,iphoneだと基本的に全部そう(純正メモもそう)だった。
  • androidでは他にもあるらしいが,iphoneではspeechyというアプリが良さそう。有料版にすれば,録音の時間制限はなくなり,タイムアウトのストレスとは無縁になる。
  • 「かいぎょう」とか「てん」とか「まる」とか言えば,改行や句読点も入力される。

apps.apple.com

おわりに

  • ながら作業の効率化が出発点だったけど,これはもはやテキスト入力に代替されるのかもしれない。
  • PCが開ける環境であれば,Googleドキュメントとかをオンラインで開き口述入力し,リアルタイムで成形すればブログ作成も簡単にできるようになりそう。
  • Markdownにはさすがに対応してなさそうだけどね。さすがにね。