大企業によるビッグデータの使用は、今では既成事実として周知されています。意思決定を助け、収益と生産性を高め、運用コストを削減するといった、メリットが強調されたりもします。その一方で、データのプライバシーがないがしろにされているという批判があります。
国内外の大企業、銀行、政府機関などは、ビッグデータのメリットを十分把握して、巨大なデータセットを蓄積しています。しかし、過去10年の間に起こったハッキングの数を考えると、これらのデータはしっかり保護されておらず、データ侵害によりハッカーの手に渡ったデータがしばしばダークウェブ上で販売されたりしているようです。
結果としては、侵害された企業はある程度評判を落とし、コンプライアンス違反で制裁金を科されたとしても、おそらく顧客からのデータ収集は衰えることなく続くものと思われます。被害が発生すれば、顧客自身には何も責任がないのに、情報(経済的なもの、臨床的なもの、あるいはユーザー名とパスワードなども)が漏洩し、個人情報の盗難や経済的損失のリスクにさらされ、他のアカウントも追加の侵害に対して脆弱になります。
大企業はなぜユーザーからの明示的な許可なしにデータを収集したがるのでしょうか?サービスや製品の提供者とクライアントとの関係がどうあるべきかについて明確な指針もないような現状において、データ分析によって何を達成したいのでしょうか?営利企業の目的は1つのこと、すべてを収益化することに集約されます。
個人的には、データサイエンスは、(願わくは依然として判断基準に倫理的観点が適用される)アカデミックのレベルに留まるべきであり、国家の利益や監視のために使われるべきではないと信じています。そのようなことは起こらないと思うのですが…
ビッグデータは、天気予報、気候変動分析、都市運営、社会的正義などの、多くの有意義なアプリケーションに使用されています。そういったアプリケーションは、ビッグデータを使用しはしますが、個人を識別するデータを使用するわけではなく、個人識別可能情報(personally identifiable information、PII)が危険にさらされることはありません。
膨大な数のハッキングが起きており、何百万ものユーザーが侵害の被害にあっている事実から言えることは、企業にデジタルデータを保護することは不可能と言っても過言ではないということです。暗号化さえしていなかったり、弱いパスワードを設定するなど、パーミッション管理がずさんなところも多いようです。金融機関や 医療機関がサイバー犯罪者にとって魅力的な標的であることは、かなり以前から知られているにもかかわらず、これらの貴重なデータを保持している企業は、サイバーセキュリティの基本原則を無視しているようにさえ見えます。私は、古き良き時代に戻って、すべての機密扱いの(金融および医療の)取引と保管を、紙のファイルによる処理に戻すことを提唱します。グローバルなインターネットへの接続には、ハッカーがリモートから攻撃を仕掛けることができるという欠点がありますが、物理的なファイル・キャビネットへのリモート攻撃は、まず考えられません。
もちろん、ビッグデータのセットは金融取引や診察のデータベースだけに限られるものではありません。人々のデジタルおよび私生活のあらゆる側面は、将来の分析のために追跡され、記録され、そして保存されます。このような活動は、プライバシーの侵害という認識はあまりされず、定量的分析または予測分析と呼ばれています。企業は、サービスを利用してもらったり製品を購入してもらったりするだけでは不十分であり、データサイエンティストやソフトウェアによって作成されたアルゴリズムを利用した、より深い洞察が必要だと考えています。
オンラインでもプライバシーがあると信じたい人がいるかもしれませんが、遺憾ながらその淡い希望は断念せざるを得ないでしょう。特殊なツール(例えばTor、Signal、ProtonMail といったようなツール)を使用しない限り、オンラインで行われるすべてアクティビティは何らかの方法で追跡されます。ブラウザ検索、サイト訪問、ソーシャルメディアのやりとり、そしてオンラインでのコメントはすべてさまざまなデータセットの一部です。ユーザーエクスペリエンスをパーソナライズするためという公式の見解が出されていても、ほとんどの場合は、パーソナライズされたマーケティングや広告配置などのために利用されるわけです。
ビッグテック、つまりグーグル、フェイスブック、アマゾンのような会社は、ビッグデータからかなりの収益がもたらされるので、ビッグデータの収集には投資を惜しみません。コメントした内容に関連するものについての広告が、自分のフェイスブックに追加されたのに気がつくことがあるかもしれません。アマゾンの Alexa、アップルの Siri、そして最近までグーグルの Assistant は、すべてデフォルトで音声を収集し、音声認識とそれに関連するAI技術を強化するためのデータ蓄積を重ねて、その過程において人々のプライバシーを侵害してきました。
幸いなことに、時代は変わりつつあり、多くの国でデータとプライバシー保護に関する法律が施行され、大企業やデータ取り扱い方法への制約が強められています。
よくデータ収集の最大の問題として指摘されるように、適用される規制へのコンプライアンスは、プライバシー侵害に関わる人々にとって既知の問題です。グーグルとフェイスブックはすでに多額の制裁金を科されており、捜査中のものもたくさんあります。
EU の GDPR はユーザーを保護する重要な法律として認識されていますが、政府がデータ・プライバシーについてより厳しい姿勢をとるよう備えていることを明確に示しています。他の国々の法律も、GDPR の重要な原則を念頭に置いていると思われる部分が散見します。米国では、カリフォルニア州を含め、いくつかの州で同様の原則が法律に採用されています。類似の連邦法はまだ制定されていませんが、要望は出されています。
データ収集には、明らかにプライバシーの問題が存在するので、すでにデータを収集している企業は規制を遵守しなければなりません。コンプライアンス違反にはペナルティが課されるべきです。ビッグテックだけではなく、そしてヨーロッパに顧客を持っていない企業であっても、すべてのデータ収集活動に GDPR で採用されているデータ保護の原則を適用する必要があるはずです。クライアントやユーザーのデータは、保護する価値があるものではないでしょうか?
ビッグデータを活用することを検討している場合は、それに伴う課題についても検討する必要があります。ビッグデータを活用するには、簡単には得られないスキルが必要です。データサイエンティストや関連する専門家の不足が取り沙汰されていますが、人手不足であれば人件費も高騰します。
特に収集されたデータが複数のソースからのものである場合、データ品質を保証することは非常に困難です。もしいくつかの「匿名」の事実の組み合わせによって特定の人が知らないうちに識別されてしまう可能性があれば、PII を削除するのは至難の業でしょう。
ユーザーはプライバシーを要求します。ビッグデータによって過去の遺物のように見えても、プライバシーへの要求はなくなることはありません。最近の規制コンプライアンスの強化もそれを後押しします。ユーザーやクライアントに関連する様々なデータを安直に収益化する企業は、PII を確実に削除する必要があります。そうしないと、規制コンプライアンス違反の制裁が待っているでしょう。
ビッグデータがもたらす利便性は否定できないところまできていますが、すべてを分析する必要はあるでしょうか?製品やサービスは、その製品やサービスの品質、そして紹介や好意的なレビューによって得られる評判を基準にして購入決定されていました。今は、顧客であるだけでは十分ではないように見えます。うんざりするほど、様々な「親切な」リコメンデーションが押し寄せます。病院に行ったからといって、求めてもいない保険、不動産、その他の産業のマーケティングデータベースに取り込まれてしまうことが許容されていいとは思えません。
複数のソリューションを使用しながら、私がどのような対処を行っているか説明しましょう。オンライン中は、VPN(地理位置情報データを無効にするため)を使ってビッグデータがポイントできないようにし、また広告ブロッカーを使用します。必要なとき以外は、スマートフォンで位置情報サービスとGPSを無効にします。追跡者に与える情報は少ないに越したことはありません。海外出張者が、話せない言葉を適切に表示するのに有用だからと個人情報を与えるのは妥当なのでしょうか?あらゆる方法で情報を集めることにより、ウェブサイトと検索エンジンはユーザーのシステム言語を推測できてしまうのではないでしょうか?
私の考えでは、ビッグデータは多くの問題を内包しています。プライバシーを重視する人は、プライバシーへの考慮なく個人データを収集するサービスを使用するのをやめるべきです。私はフェイスブック・ページを持ってはいますが、誰に見られてもいいものだけを投稿します。家族がいやがるような家族写真も、会社が困るようなコメントも載せません。私がある野菜が嫌いなことや、私が非倫理的な商慣行に対して嫌悪感を持っていることなどは、いろいろなところで公表していますが、それを商業的に利用されることは断固として拒否します。それ以外、 監視カメラが何を追っているのかをチェックしていることや、どんな支払いをしたか、どこに滞在してどこに旅行したか、そしてもちろんそれ自体が監視の原動力となるスマートフォンなどは、すべてプライベートな内容です。私は自分のささやかなプライバシーを大切にしたいと思います。読者の皆さんはいかがですか?
An Irishman based in Hong Kong, Michael O’Dwyer is a business & technology journalist, independent consultant and writer who specializes in writing for enterprise, small business and IT audiences. With 20+ years of experience in everything from IT and electronic component-level failure analysis to process improvement and supply chains (and an in-depth knowledge of Klingon,) Michael is a sought-after writer whose quality sources, deep research and quirky sense of humor ensures he’s welcome in high-profile publications such as The Street and Fortune 100 IT portals.
より優れた業務アプリケーションやウェブサイトの開発に役立つ、ニュース、情報、チュートリアルをご案内します。
The specified form no longer exists or is currently unpublished.