もりはやメモφ(・ω・ )

インフラなエンジニアからSREへ

初めての音声入力を試してみたよ

初めての音声入力ーパチパチパチパチパチ!!!

というわけで本記事は基本的に音声入力を利用しています。

どうして音声入力を利用しようと思ったかと、そのモチベーションを記事にしていきたいと思います。

誰もが世界に対して自由に発信ができる今日、ブログであったり SNS での発信はとても重要なものだと認識しています。 しかしその一方で、なかなかこまめにブログを、あるいは SNS での発信を行っていくことは、大変なことだと認識しています。要するに筆不精っていうやつですね。 筆不精にはいくつか理由があると思っていて、最たるものが時間がない、あるいは面倒くさいというものだと思っています。

ではどうすればその面倒くささがなくなるのかという点を考えたところ、それはもう技術に頼るのが一番だという認識を持っていました。 有名なところでは"ひげぽんさん"であったり、 TwitterのTLに現れる優秀なエンジニアの皆さんが、所々で音声認識はなかなか良いよとの言葉を見かけたりしたので、興味は持っていました。

前提

前提として私の入力環境をお伝えしておくと、機材は MacBook Pro の2018年モデル、 OS はMojaveです。Catalinaに上げない理由としては、熱心なアップル信者でもないので新 OS に対しては比較的コンサバティブな方だからです。

入力は当初、 Mac 標準の音声入力を使おうとしたのですけれども、少しばかり使ってみたんですがもう一声という感触を得ましたので 、Google の音声入力を行っています。 Google の音声入力した際は Google の Chrome を利用して Google Docs のツールから音声入力を選ぶという形で利用しています。

感想

ここまで打ってみて、かなり快適な制度見せているという認識ですので、これはもう今後使っていくしかないかなと手応えを感じています。

感触ではありますけれど、変換の精度とか、後から手で直す時間を考えても、おそらくは手で入力する時間に対して2/3もしくは3/4程度の入力時間及び負荷ではないかなと感じています。

このまま単純に記述してブログにするには、個人ブログであるという立て付けはあるものの、あまりにも内容に乏しいという感触がありますので、せっかくだから、音声入力をしただけの状態と、人間が校正をしたその差分の例を提示することで、この記事に意味を持たせたいなと思います。

音声入力と、それを手直しした差分

というわけで github の差分を提示しておきますので興味のある方は見てみてください。

github.com

最後に

ここまで入力してみてコツと言うか、ある程度使い方がわかってきた気がします。 ポイントとしては、これは当たり前ですが、一語一語を丁寧に、文節をはっきりと言うことが大事であると感じました。加えて句読点であったりエンター=改行ですね、それらを入れるキーワードや符牒といったもので入力することは現状できないようですので、基本的にはキーボード上に手を置いた状態で、句読点であったり改行は音声で書きつつ適切に入力していくと、そんな方法が有効だと感じました。

というわけで、今回音声入力が非常に有効であるという手応えを得ましたので、今後のブログあるいはそれ以外の執筆活動に関しては、ぶつぶつ言える環境ではないという以外のケースで 、積極的に音声入力を利用していきたいと考えています。

この記事を読んで音声入力をやってみようかなと思ったかたは、 Google アカウントをお持ちであれば誰でもできますので、今すぐトライしてみてはいかがでしょうか。

蛇足として

ざっと読み直したところ、やはり音声だからのくどい言い回しであったり、口語的な面が強すぎる印象を持ちました。 効率的に入力した後で、校正能力が問われると認識です。(今回の記事の校正は弱めです)