スマートスピーカーの大躍進と更に拡大するデータ収集、プライバシーの懸念について

日米、アジアで大いに流行りだしたスマートスピーカーに対してプライバシーに関しての警鐘を鳴らしている記事の翻訳と雑感です。

元ネタ
Alexa, What Are You Doing with My Family's Personal Info?
Amazon Alexa, Google Assistant and several smart-home technologies that debuted at last week’s CES add convenience but also raise privacy concerns

Alexa, What Are You Doing with My Family's Personal Info?
https://www.scientificamerican.com/article/alexa-what-are-you-doing-with-my-familys-personal-info/


スマートホームが大躍進したCES2018

今年のアメリカ最大の家電見本市CES@ラスベガスでは、スマート音声認識システム、スマートホームテクノロジーの宣伝とパートナーが作るプロダクトであふれていました。街やモノレールなどにもAmazon EchoやGoogle Homeなどの広告がぶらさがり、それらのスマートスピーカーとインターフェースでつながったプロダクトとして、数十ものパートナー会社が、音声指示から、部屋のライトがついたり、シャワーヘッドの温度調整をしたり、インテリジェントトイレといったものまであったようです。すべてはAmazon,Google、Appleそしてサムスンも開発している、音声デジタルアシスタントがインターフェースとしてやってくれる、というものです。

今年のCESは音声コントロール一色だったといえるでしょう。しかし、一方でこの熱狂はこの技術で何ができるか、に注力しすぎていて、それがプライバシー上どんな懸念を引き起こすのか、については全く注目されていない点が見受けられました。


AmazonやGoogleの音声アシスタントは、音声認識技術で、コマンドを受けて、適切なレスポンスを返す仕組みのものです。これらのアシスタントは、AppleのiPhoneにはすでに入っていて、Androidにも同じような仕組みが何年も前から入っています。一方で、今回のGoogleホームや、Amazonアレクサなどは、音声を使って、ほかのデバイスをコントロールするというところに特徴があります。(SiriとHomekitの連携でもできたかもしれませんが)


音声認識ソフトは、人の音声の波長を変換して、マイクでキャプチャーします。そしてそれを異なる波長の揺れパターンとして認識します。そのソフトウェアのアルゴリズムは、機械学習を使って、デバイスが人の声のパターンを特定して、さらに、どの言葉やフレーズを言ったのかを聞き分けられるようにします。フレーズなどは、Hey, Alexa!や、Ok, Google、などですね。

さらには、このアルゴリズムは各国言語ごとの辞典づくりを要します。翻訳できるようになるソフトウェアも必要でしょう。加えて、GPSマッピングデータ、カメラ、加速度センサー、その他のセンサーと組み合わされば、Amazonアレクサや、AppleのSiriは、様々なコンテキストを構築・表現することができるようになります。例えば、近くにレストランを提案したり、そこへのドライブをナビゲートしたりすることができます。


需要と実際の効果について

この技術の需要は非常に伸びています。騒がしい部屋で実際に聞き取りに困難な環境で使われながらも。Pew リサーチセンターでは、4135人の人たちに昨年12月に調査として、
音声アシスタントの正確性を実験しました。だいたいよかったと答える人は39%、いくつかのコマンドは大丈夫だったという人が42%、そして、16%はほとんどだめだったと回答

Bangor大学のデジタルライフ分野の教授、Andrew Mcstay氏の話では、テクノロジーの瞬間的な強さとは、ユーザーに対して、即座に必要な情報やエンターテイメントを提供できることです。デジタル音声アシスタントは、ものごとをリクエストするときにタイピングする手間を省きました。それはとてもナチュラルなインストラクションなのです。しかし、この技術、デバイスは、ときどき、重要な概念の理解をしていないことがあります。それは、とてもフラストレーションがたまります。

英国のノッティンガム大学社会学・社会政策学部の上級研究員であるMurray Goulden氏は、デジタル音声アシスタントがタッチスクリーンと同じくらい有用なものになる前に、 「私の家で2日間アレクサを使った後の私の主な経験は、私が[そのデバイス]と通信できるように子供たちに静かに話すことでした」とGoulden氏は話しました。

「アレクサの音声認識は印象的ですが、周囲の騒音があれば絶望的です」

この技術は個人ユーザー向けに設計されているようですが、家に持ち込むと必ずしもそう効果的にワークするわけではありません。

技術の欠陥があるにもかかわらず、Googleは、CESの前に自社の音声アシスタントがGoogleホームに、Androidのスマホやタブレット、さらには、iPhoneまでカウントし、で使える音声認識装置もも含めて、既に4億人に使われている、とアナウンスしました。

また、Googleホームとそのシリーズはすでに1000万人に販売されて、空気清浄機や予約調理マシン、警報システムなどなどのようなホーム家電のコントロールできるものは1500以上あるともアナウンスしました。

Amazonは、アレクサデバイスを世界中で、2017年にホリデーシーズンだけで1000万台売れたと発表しました。そして、その間、アレクサは、非常に多くの検索や家電の制御を助けたこともジョークを言うことについても助けたと、アナウンスしました。


集めたデータの利用


アレクサで集めたデータでは、マンハッタンの最も注文されたクッキーやチョコレート、ドリンクなどを明らかにし、最もリクエストされた曲はジングルベルであるなども示しました。また、アレクサは、Amazonにもっとも一般人がUSとドイツでホリデーシーズンに呼んだ言葉はMomであるとそして、UKでは、Dadだと示しました。

これらの情報を集めることは一概に悪いと断じないまでも、しかしそれは確かに、Amazonのマーケットプロダクト、ショッピングを助ける道具になるでしょう。

音声インターフェースは、AmazonやGoogleにとって、これまでなかった情報を集めることができるようになります。それは、ショッピングやインターネット上のふるまいデータだけではなく、どのように家のなかで日常をふるまっているか、ということまでもデータ収集の対象になると考えられています

オンラインとオフラインの情報を集め、我々が何を何を欲して、購入するのか、Googleたちはさらによく理解することになるでしょう



技術インパクトと高まるプライバシー懸念

プライバシーの懸念は、すぐにディールブレイクになるものではなありませんが、その懸念は、テクノロジーが広がるごとに成長し、大きくなっていきます。AppleもSiriを使い、スマートホームへの参入を決めました。Home Padです。今年中のリリースで開発を進めています。既にAppleもSiriをIpadなど様々な製品に入れています。AppleTVもです。

サムスンは音声操作のデジタルあいっスタントを昨年紹介し、2020年までには、すべてのプロダクトに含めることとしています。

Bixbyと呼ばれるものです。すでに冷蔵庫に組み込みCESで展示していました。サムスンがCESで発表したスマート・アイスボックス「ファミリー・ハブ」には、Bixbyだけでなく、補充が必要なときに家庭のメンバーに通知を送信できる内蔵カメラを制御するためのタッチスクリーンが含まれています。蛇口やその他の配管設備のメーカーであるMoenは、CESに1,200ドルのデジタル制御シャワーシステムを導入した。そのシステムは水温と流量をAlexやSiri経由で音声コマンドで制御できる。家庭用品小売業のKohlerは、Numiインテリジェントトイレを導入しました.Numiインテリジェントトイレには、音声制御の周囲照明をさまざまな色で、Bluetooth接続と暖かいシートとフットウォーマーが含まれています。


私たちは盗聴されていないか?

GoogleやAmazonは、アレクサや、OK,Googleなどの目覚めの言葉を言わない限りはけっして音声を録音しないと主張しています。しかし、音声の録音を始めた時のデータはすでに聞かれているということでしょう。例えば、音楽を再生中などもどうでしょうか

また、どのようにして、家族が、簡単にデータ収集を家の中で管理できるのかが、不明確です。このことについては、そのようなデータ管理は、我々コンシューマーには管理できないし、また、そのようなデータが誰に、どうアクセス、管理されるのかが不明確です。

スマートスピーカーは時には家のリビングなどに置かれ、様々な家族の人の声や行動を拾うことになります。家族の中でも、だれがどのプライバシーを管理できのかは、複雑な問題でしょう。

現状ですと、Amazonアカウントで分けているので、その人が管理主ということにもなりかねないです。


雑感

とんでもないデータ量がAmazon、Googleに収集されていて、個人に紐づけされていることに改めて危機感を覚えたのと、GoogleがCESで行った数々の誇大広告について、思うところがありました。

彼らは結構、いやアメリカ人全般かもしれませんが、広告宣伝のため、大言壮語を使うことが多くみられます。実際は同じようなスペックのものを並べて、差がつくような処理方法を選んで、1億倍速いとか。つまらないハードルに目を向けさせないように、大きな問題を解決しようとしていることに注目させるとか。

言い方って大事だな、そしてアメリカ人はそれが巧みに感じます。我々も見習いましょう。

記事にもある通りまだまだスピーカー自身の精度や機能、スキルについては欠陥も多いので、まだ音声統一インターフェースの時代はこないと思いますが、近づいてきていて、そこを目指している、Google、Amazon、サムスン、一番の危機感はやはり日本側がキャッチアップできていないこと、ひたすらデータを吸い上げられ、吸い上げさせている側に回っていることですね。

データ蓄積、活用の面においては、アメリカにやられっぱなし。

PFNのようなAIに強い会社と結託して、日本側ももっとネットワーキングを重ねながら、キャッチアップするだけでなく、いい方法を見つけられないだろうか。

今のところ、検索、EC、SNS、スマートスピーカーなど、だいぶ押さえられてしまっています。

エンタープライズや工場データもいいですけど、コンシューマーの規模と経済には勝てないと思うんですよね。やっぱりB2C、そうなると、リクルートがやはり有力候補かなと思ったりしています。食べログもポジション的にはいい。ニコニコはもういろいろと厳しい。

以上

Comments