2010年01月23日

iPhoneアプリ/音声認識メールST (3GS専用)

音声認識メールというアプリがある。
名前のとおり、音声でテキスト入力が可能になる凄いアプリ・・・と言っても、今では非常に音声認識率の高いGoogle Appsなんてものがあるのでそれほどありがたみを感じないかもしれない。しかしGoogle Appsの音声認識は、あくまでGoogle検索に用いるためのものであり、Google検索でヒットしやすい単語を自動で拾ってくるため素晴らしい音声認識だと勘違いしているだけだと思う。実際の話、検索でヒットしないような単語は絶対に認識しない。

脱線した。ともかく音声認識メールはGoogleのそれとは違い、純粋にしゃべった言葉をテキスト化することが売りで、高認識と評判も高かったこともあり前々から気にはなっていた。

しかしこのアプリ、月額制かつ個人情報をメーカーに明け渡さないと使えない(起動時に名前と連絡先をサーバー送信するとかなんとか出る)、ということでユーザーレビューも散々で、もう無かったことにしようと記憶の片隅に封印していたのだけども、ついにサーバーを介さない、かつ売り切りスタンドアローン型が出たので買ってみた。

音声認識Mail 1.1 


使い勝手なんですが、もう結論から書けば「起動遅すぎ!」これに尽きる。


起動させるとロゴの後に音声認識エンジンの初期化が始まる。これがくせ者。

IMG_0575 

ずーっとこの状態が続く。しかも起動するたび、毎回。

アプリ起動から使えるようになるまでをストップウォッチで計ると22秒〜24秒くらい。いちおうSafariの開いたページは全部閉じて、メモリクリーナー系で空きメモリを空けての秒数。今どき起動にこんなに時間がかかるアプリがあることにある意味衝撃を受けた。

この時点で自分の中ではお蔵入り決定してるのだけど、せっかくなので使い勝手を見てみる。



IMG_0576 

使えるようになったところ。音声入力の方法は2つ。「押しながらしゃべってください」ボタンを押しながら、のやり方と電話かけるようにしゃべるやり方。個人的には後者のやり方がしっくり来た。というか、ボタン押しながらの方は恐らくバグで認識がうまく行かない。電話方式は問題なし。



 IMG_0591 

辞書を内蔵しているのでそれなりに有名な単語はほぼ確実に認識。



IMG_0609IMG_0577

Google Appsと違うところは、このアプリはメール前提なので当然文章で認識してく。平易な文章ならけっこう認識率高いかも。よさげ。しゃべり言葉とか方言入ってくるときっと難しいんだろうなあ。試してない。



IMG_0579 IMG_0580

認識したテキストを他のアプリに持ってくためには左上の「テキストコピー」をタップ。そうすると連携できる(とは言い難いが)アプリ群を選べる。



 IMG_0581 IMG_0582

メールを起動させてみたところ。本文にさっきコピーしたテキストがちゃんと入ってる。なかなか良いかも。残念ながら宛先は自分で選ぶしかないけど。SMSもこのパターンで使用可能。

ちなみにクリップボードへコピーされてるにすぎないので、手動でメモでも立ち上げれば内容をペーストすることが可能。一応。



IMG_0583 IMG_0584

地名の認識テスト。ちゃんと認識した。テキストコピー>MAP起動で該当場所にピンが立つ。なお、これやる場合は住所認識の後に「改行」を入れること。よくわからんけどそう書いてあったような気がする。



IMG_0601 IMG_0602

テキストコピーしてSafari起動の図。自動入力じゃないんかい!この分野ばっかりはGoogle Appsの圧勝。



IMG_0588

設定画面。上から、
・認識できない単語を追加
・連絡先に入ってる姓名を認識(よみが入ってる場合のみ)
・テキストコピー後の動作設定
・Safari起動時URLとTwitterアカウント設定



IMG_0599 IMG_0600

まず設定のその他群。使う人は設定しましょう。



 IMG_0592 IMG_0594

認識できない単語を「単語追加」してみる。



IMG_0596 IMG_0597

おお、ちゃんと認識できるようになった。ただ、ちと例が良くなかったようで認識率はイマイチ。写真は3回目で成功した画面。



IMG_0608 IMG_0603

「単語追加」画面の単語のインポート・エクスポートは、同社の音声認識メール(月額制版)で自動学習した単語をインポートしたりする機能らしい。

これ、もしかしてテキストで別形式に作って一括登録なんかできちゃうの?とか思ったけど、読込形式見るためにエクスポートしてからメモ帳にペーストしてみたらペーストできなかった。特殊形式なのかなあ。単語一括登録チャレンジは形式が分からないので中止。



moji IMG_0607

音声入力の時にタップで入れられる文字は左のもの。絵文字が入れられるのが売りらしい。音声入力以外にも、通常のテキスト入力も可能。切替は右上の○○入力ボタン。



ざっと使ってみたのだけど、起動が死ぬほど遅いことを除けば、比較的優秀なアプリなんだと思う。肝心の音声認識は悪くないし。思うのだけど、それを完全にぶち壊す起動時間の遅さ。毎回20秒弱は自分には耐えられない。非常に惜しい!今後のバージョンアップで起動時間の短縮に全力を注いでくれることを願う。


追記。

メーカーの方で起動が激遅になる問題を認識したようで、アプリ説明に追記がありました。なんでも「連絡先の件数が多い」「連絡先の姓名を認識機能をON」状態だと異常に遅くなるとのこと。また、当面の解決策として「連絡先の姓名を認識」機能をOFFすることだそうなので言われたとおりにした後ストップウォッチ片手に試してみた。

結果、起動完了までに11〜12秒と大幅改善。1回だけ18秒という記録もありましたが。ギリギリ使用に耐えられる線?日常的に使うとなるとまだまだストレス溜まる起動時間かなあ。今後、起動時間を削る方向で取り組んでいくようなので温かく見守りたいと思う。


追記(ver1.2)

1.2にバージョンアップした。さくさくモードとじっくりモードが追加となった模様。どんだけ差が出るのか、またもや起動時間をストップウォッチで計測してみた。

(1)連絡先姓名認識OFF

さくさく1回目 約17秒 じっくり1回目 約12秒
さくさく2回目 約8秒 じっくり2回目 約12秒
さくさく3回目 約9秒 じっくり3回目 約12秒

(2)連絡先姓名認識OFFのままメモリクリーナーアプリでメモリ解放

さくさく 約11秒 じっくり 約13秒

(3)連絡先姓名認識ON

さくさく1回目 約10秒 じっくり1回目 約13秒
さくさく2回目 約10秒 じっくり2回目 約13秒
さくさく3回目 約9秒 じっくり3回目 約13秒


メモリ解放するといったん起動が遅くなる以外は概ねスピードアップしてるみたい。姓名認識の有無で約1秒差。なかなか。でもあと一歩な感じかなあ。目指せ5秒!

posted by vyooke at 17:57 | Comment(0) | iPhoneアプリ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。