研究所紹介  

   

活動  

   

情報発信  

   

あいんしゅたいんページ  

   

音声認識再訪

詳細

私は以前音声認識に関するエッセイを書いた。その時は様々な音声認識アプリに関して評価を行った。その時の評価ではスタンドアロン型としてはWindows 7の音声認識、クラウド型としてはiPhone 、 iPad用のドラゴン・ディクテーションが良いと述べた。しかし現状では違っているので、この一文では私に関する現在の状況について述べよう。

まずスタンドアロン型に関してはニュアンス社のWindows用のドラゴンスピーチ11Jである。ちなみにドラゴンスピーチもドラゴン・ディクテーションもその音声認識エンジンは同じニュアンス社のものである。違いは、ドラゴンスピーチはスタンドアロン型でドラゴン・ディクテーションはクラウド型と言う点である。

ドラゴンスピーチに関しては長い間バージョンアップされなかったので、前回は評価の対象から外したが、最近バージョンアップされたので購入して試してみた。結論から言えば非常に良いということである。私はこの文章を現在、そのアプリを使って入力している。非常に調子が良い。感動するほど調子が良い。というわけで、 Windowsに関してはこれで決まりである。使い方はWindows 7の音声認識と似ている。日本ではジャストシステムが販売している。問題点は価格が高いことである。ヘッドセットが付いているかいないか、アカデミックバージョンであるかないかによって値段が異なる。だいたい1万から2万円の範囲にある。しかしWindowsで音声入力を真剣に考慮している人には、お勧めである。

クラウド型に関してはAppleの音声入力である。これはiPhone 、 iPad 、 Mac共通である。この認識精度も非常に良い。しかも無料である。問題点はよくも悪くもクラウド型であるということだ。つまりネットに接続していないと使用できないということだ。私の場合、無線ルーターから遠く離れた部屋で音声入力する場合は時々切れることがある。その場合はフラストレーションが溜まる。強力な無線ルーターを買うか、あるいは無線ルーターの近くで仕事するかである。

ともかくも音声入力は充分実用の範囲に入った。音声入力の問題点は文体が変わるということだ。つまり書き言葉よりも話し言葉に近くなるということだ。話し言葉は冗長である。本当は頭の中で完全な書き言葉を練ってから話せばよいのであるが、それがなかなか難しい。その場合はともかくも思いつくことを全て喋って、後で修正すればよいのだ。文体が変わるという問題は、手書きからワープロ入力に変わった時も発生した。 ある書道家は文書は手書きでなければならないと主張した。彼が今もその主張を貫いているかどうかは知らないが、彼以外そのようなことを言う人は現在ではいないであろう。それほどワープロ入力が普及しているのである。今後は音声入力が普及していくであろう。


松田卓也(まつだたくや)
1943年生まれ。宇宙物理学者・理学博士。神戸大学名誉教授、 NPO法人あいんしゅたいん副理事長、同付置基礎科学研究所副所長、中島科学研究所研究員、ジャパン・スケプティックス会長。 1970年、京都大学大学院理学研究科物理学第二専攻博士課程修了。京都大学工学部航空工学科助教授、英国カーディフ大学客員教授、神戸大学理学部地球惑星科学科教授、国立天文台客員教授、日本天文学会理事長などを歴任。主な著書に「これからの宇宙論--宇宙・ブラックホール・知性」 (講談社ブルーバックス) 、 「正負のユートピア-人類の未来に関する一考察」 (岩波書店) 、 「新装版 相対論的宇宙論--ブラックホール・宇宙・超宇宙」 (共著、講談社ブルーバックス) 、 「なっとくする相対性理論」 (共著、講談社) 、 「タイムトラベル超科学読本」 (監修、 PHP研究所)、「2045年問題--コンピュータが人類を超える日」(廣済堂新書)など
   
© NPO法人 知的人材ネットワーク・あいんしゅたいん (JEin). All Rights Reserved