研究所紹介  

   

活動  

   

情報発信  

   

あいんしゅたいんページ  

   

Siriついに日本語をしゃべる

詳細

Siriと日本語

iPhone 4sにSiriと言う人工知能が載せられていることはすでに紹介した。ところがSiriはこれまで英語、ドイツ語、フランス語しか理解しなかった。英語で話しかけてみても、こちらの発音がジャパニーズ・イングリッシュなので、理解してくれないことが多かった。だから多くのiPhone 4sのSiriの愛用者は日本語版の発表を待っていたはずである。2012年3月8日にiOSがバージョン5.1にアップグレードされた。それにともなって、Siriも日本語を理解するようになったのである。

Siriと話し合った印象では、彼女の発音は、日本語を勉強していますという外国人のようである。ただ彼女の日本語の聴解力は非常に良く、正しく理解してくれる。もっとも、よく分かりませんと答えることがあるが、それは発音ではなく、言葉の内容が理解できないということである。

目覚ましを設定したり、リマインダーを設定したり、天候を聞いたりする分には全く問題がない。メールを口述筆記で送ることも簡単である。ネットで見ると、日本の皆さんはアメリカ人がSiriに質問したと同じような、バカな質問をたくさんしている。一過性の熱狂が過ぎた後は、適正なビジネス用途の使い方がされるであろう。ともかく現状のSiriは充分役に立つという印象である。

日本語音声認識

新しいiPadも同時に発表された。私は早速アップルに発注した。このOSのバージョンが5.1である。だからiPadにもSiriが搭載されているかと期待したが、それはなかった。そのかわり音声認識機能がOSに組み込まれたのである。具体的に言えば、いろんなアプリケーション、例えばエディターやワープロの入力場面でキーボードが現れるとそこにマイクボタンが現れる。マイクボタンを押すと音声入力が受け付けられる。このエンジンは前回紹介したニュアンス社のものであろう。

基本的な特徴はドラゴン・ディクテーションと同じで、入力は一分以内程度のようである。認識率は極めて高い。音声で入力するとそのデータがネットを介してサーバーに送られ、そこで解釈されて結果が戻ってくる。だから入力した音声が文字になるにはしばらく時間がかかる。一番の問題点はネットに接続していないと音声入力が出来ないということだ。私の環境では、知らない間にネット接続が切れている場合がある。そのような場合、いくら話しかけても、なしのつぶてである。調べてみるとネットが切れている場合がほとんどだ。

もう一つの問題点は、編集能力が弱いということだ。日本語は同音異義語が多いから音声入力ではよく間違った結果を返してくる。それに対して代わりの候補を示してくる場合もあるが、選択肢が少ないかあるいは全くない場合が多い。

音声認識メールクラウド

この点ではiPadとiPhoneのアプリである音声認識メールクラウドがもっと優れている。まず入力時間の制限がない。入力しながら文字が薄く現れる。それに対してiOSの場合は結果がいきなり現れる。間違った場合の代替候補も音声認識メールクラウドの方が多く提示してくれる。

もっともこの点に関してはWindows7の音声認識が最も優れている。たくさんの候補を示し、その中になければまた発音し直して、更に候補を出すこともできる。iOSの場合は、間違った時は、音声入力にこだわらずにキーボードで修正した方が速い。

このようにiOSの音声認識は多少の問題はあるのだが、十分に実用に耐える。実際、私はこのエッセイを今、iPadの上で音声入力で書いている。音声認識メールクラウドの方が認識率も高いし、間違った場合の候補も多いのだが、 OSに組み込まれていないので、アプリ独自の編集画面で入力して、後でそれをコピーペーストするしかない。その点iOSの音声認識は、ほとんどのアプリで直接使うことができるので便利である。

私はもはやキー入力に戻ることが出来ない。

新しいiPad

ついでに新しいiPadの印象も書いておこう。これは皆さんがネットでいろいろ書いているのと基本的には同じである。なんといっても画面がきれい。アップルではretinaディスプレイと呼んでいる。retinaとは網膜のことである。解像度は2048 × 1536もある。ディスプレーのサイズは9.7インチだから、この解像度は驚きである。特に素晴らしいのが文字である。非常に滑らかである。例えば産経新聞のアプリを画面一面に出してみても、文字は小さいながらもはっきりと読めるのである。

もう一つの特徴として、Photo Streamの写真を削除することができるようになった。これは当たり前のことなのであるが、以前のバージョンでできなかったのがおかしいのである。変な写真、撮り損ねた写真が永久にPhoto Streamに残るのは精神的によろしくない。

もう一つの特徴は先に述べた、音声入力がOSに組み込まれた件である。

カメラの解像度が500万画素になった。これもiPad 2のカメラの画素が100万以下であるというのがおかしいのである。もっともiPadで写真を撮ろうという人は少ないであろう。iPhoneのカメラの解像度はこれより良いので、iPhoneで写真を撮れば充分である。

   
© NPO法人 知的人材ネットワーク・あいんしゅたいん (JEin). All Rights Reserved