Voice-Recognition-Tech Info #6

braitom
Voice-Recognition-Tech Info
7 min readMar 26, 2017

--

Article

Amazon Alexa、個人を識別する音声認識機能を開発中? | ロボスタ — ロボット情報WEBマガジン

AmazonがAlexa向けの音声認識をユーザーの識別もできるようにしようとしているという噂があるようです。声紋で個人を特定するかも?とのことです。

この噂が本当なら非常に強力な機能になりそうです。これによりよりプライベートなSkillsも利用できるようになり用途の幅が広がると思います。

Voice IDというIDで個人を特定するという具体的な話も出ているのである程度、現実味のある話なのですかね?

Voice User Interface Design: New Solutions to Old Problems — Microsoft Design — Medium

VUI(Voice User Interface)のデザインが今後デザイナーにとって重要な戦略スキルになってくるということが書かれています。

どの製品も現在はまだ音声UIレベルであり、会話型UIまで達していないということを意識する必要があり、大事なのはあくまでも「タスク」を完了できるように設計すること。
また、音声UIで最もインパクトのあるメリットはアクセシビリティの向上であるとのことです。

かなり大事なことが書かれています。音声UIと会話型UIを混同してしまうのは気をつけないといけませんね。同じ文脈で使ってしまうと混乱を招くので注意する必要がありそうです。

また、アクセシビリティ観点は本当に大事だと思います。視覚障害者の方、子供、高齢の方、誰でも使えるのが音声であり、その層にもアプローチできるアプリを考えることが音声UIアプリを作る上で最も考えないといけないことなのかもしれません。

最新AI音声アシスタント「Clarity」、タッチパネル付きで「Alexa」にも「OK Google」にも対応! | ロボスタ — ロボット情報WEBマガジン

AlexaとGoogle音声認識が両方使えるというデバイスがクラウドファンディングに登場しているそうです。しかも99.99ドルと低価格。タッチパネルも搭載とのことです。

コンセプトは面白いですがまあクラウドファンディングの製品なのでそこまで真に受ける必要はなさそうです。一見すると便利な気もしますが、どっちに何聞けばいいのか分からなくなる気がするのでユーザー体験は微妙な感じがします。

5 Things Google Assistant Does Better Than Siri

Google AssistantとSiriの違いがまとめられています。スマートフォン向けの音声アシスタントとしてはSiriよりはGoogle Assistantの方がユーザーにとって親切な設計であることが伺えます。

Google Assistantはチャット形式のUIを取っているというのも利便性に繋がっているのでしょうね。

Alexa, Please Send This To My Screen — Startup Grind — Medium

音声操作でもマルチデバイスでのエクスペリエンスを考えることが大事だという話です。
そのためには一貫性、連続性、相補関係性が必要。現在それがどのくらいできるのか、課題は何なのかがまとめられています。

連続性(1つのデバイスからもう1つのデバイスにエクスペリエンスが渡せる)は特に大事だと思いました。記事にも書いてありますがGoogleなんかはこれが非常にうまいですよね。

例としてmosaicを挙げています。Alexaでニュースを受け取ったときに「送信するか?」聞いてくるそうです。送信するとその記事をチャットボットがmessangerに送ってくれるとのことです。確かにこういう使い方ができるとかなり便利だと思いました。

こういうTotalでの体験を通じてVoiceアプリを考えていかないといけませんね。

例)

  • お勧めのテレビ番組を聞く、そのままTVへもしくは録画予約する
  • 目的地までのルート検索をする、その結果をそのまま車のナビへ送信もしくは電車の乗り換え情報をスマートフォンへ送信する

Development

Utterances, Slots, And Skills: The New Vocabulary Needed To Develop For Voice — Medium

Alexaを開発するときに知っておく必要がある用語の解説がされています。

AlexaとEchoの違い、Wakewordなどの基本的なことから、開発時に必要なIntent、Slotといった用語までカバーされています。これからAlexaの開発に関わるエンジニア、デザイナーの方は読んでおくとよいと思います。

Why learning to code Alexa Skills is the gateway to a cloud computing job

Alexa Skillsを開発することはクラウドコンピューティングのスキルを取得するのに向いているという話です。
AWS Lambdaを使ったサーバーレスアーキテクチャの仕組み、APIベースのサービス間連携などを学ぶことができるという強みがある。

これはかなり同意できます。Alexa Skillsを開発するならAWSの各種サービスのことは知っていないといけません。その逆もまたしかり。より複雑なSkillsの開発をするためにはLambdaの制約や、サーバーレスアーキテクチャをどう設計するかが大事になってくると思っています。

--

--

国内、国外のTech系ニュースを分野問わず紹介しているサイト始めました。 https://gather-tech.info/ 音声認識や音声コントロール系のニュースまとめサイトも始めました。https://voice-rek.gather-tech.info/