矢野経済研究所 ICT・金融ユニット

アナリストオピニオン
2014.07.07

アナリティクスの可能性を広げる「オープンデータ」と「パーソナルデータ」

データ活用が一般の人にも身近になってきた

「ビッグデータ」という言葉がもてはやされる時期は過ぎたが、「クラウド」然り、IT用語はメディアが取り上げなくなった頃に本格活用が進むもので、新しいデータ活用の事例が身近に見られるようになっている。
例を挙げてみよう。2014年ワールドカップブラジル大会では、ネットメディアのハフィントン・ポスト(http://www.huffingtonpost.jp/)が、パス成功率、シュート、プレイヤーポジションなどの詳細なデータをリアルタイムに提供するプロジェクトを行った。FIFAのサイトにも多様な情報が掲載された。以前なら専門家やチーム関係者のみが内々で利用していたような情報が、今では一般のファンでも見られる。
Yahoo!は治療の効率化と病気の予防で医療費を抑えることをテーマに、産官学連携のゲノム解析プロジェクト「HealthData Lab」(http://medical.yahoo.co.jp/hdl/)を立ち上げた。ゲノム(遺伝子)解析では糖尿病やがんなどの病気のリスク、肥満や脱毛などの体質がわかり、健康管理に活用できるほか、多数の人のデータを収集し統計学的に解析することで病気の予防法・治療法を分析することもできる。6月には無償モニター5,000人の募集を行っている。

いまデータアナリティクスの界隈で重要なキーワードとして注目されているのは「オープンデータ」と「パーソナルデータ」だ。これら2つの言葉の概要や注目すべき理由、今後の展望について紹介する。

「オープンデータ」は新たな価値を創出する可能性を持っている

「オープンデータ」とは、政府や自治体、公共性のある団体や企業などが収集しているデータ及び、それを使いやすい形で公開し、広く二次利用ができるようにする活動を指す。データの種類としては、政府による多種の統計情報、自治体の地域情報、交通情報、防災情報、気象情報、施設の情報、医療福祉関連情報などが含まれる。有効に加工し分析すれば、新たな価値を創出するデータソースになる可能性を持っている。
本省、地方局、自治体、独立行政法人がそれぞれのホームページで公開しているデータは1万件以上となるのだが、フォーマットはPDFや独自のスタイルのExcelが主流である。オープンデータは利用しやすい形で公開されるべきであり、XTMLやCSVといった標準形式であることが求められる。PDFでWebに置いてあっても、人手で数字を読み取って再入力しなくてはならない。Excelであっても、1セルに1データ、データセルに文字やカンマを入れない、といったルールを守っていなくては分析に適さない。つまり、現状の公共データは二次利用が可能な形に変換しなくてはならない。冒頭に挙げたワールドカップの事例では情報は加工済みまたはPDFで提供されていたが、元の数値データまで加工できるようになっていればある種のオープンデータとして利用できただろう。
また、省や自治体がばらばらにWebに載せるのでは利用者はどこに何の情報があるか分からないため、統一のポータルサイトからアクセスできることが望ましい。日本の取り組みは遅れており、世界42国・132地域で統一のオープンデータサイトを構築済みで、G8でサイトを持たないのは日本だけである。政府のIT総合戦略本部がオープンデータを掲載するサイトとして2013年12月に開設した「データカタログ試行版」は、2014年3月にサイト運営の予算に関する手続きの不備から突然停止するといった試行錯誤を経て、10月にようやく本格版のスタートを控えている。

利用価値は高いが、課題も多い「パーソナルデータ」

一般的に企業で扱ういわゆる「個人情報」は氏名、住所、電話番号などだが、昨今分析対象となりうるデータは、Web上の検索や購買の履歴、スマートフォンの位置情報、SNSのコメントや写真、監視カメラなどの画像、カードの利用履歴、ウェアラブル端末で収集した健康データなど情報が多岐にわたり、これらを総称して「パーソナルデータ」と呼ぶ。
事業者がこれらの情報を利用すれば、年齢や性別といった単純な条件だけでなく、生活スタイル、趣味嗜好、行動パターン、ネット活用状況などから類推される購買確立の高い顧客をピンポイントで抽出できる。最初に紹介したゲノム解析サービスは、遺伝子情報という究極のパーソナルデータを活用した新しいヘルスケアサービスだ。
パーソナルデータにつきまとう課題はプライバシー保護であり、2013年にSuicaを巡るトラブルが社会問題となったことはまだ記憶に新しい。JR東日本と日立製作所がSuicaの利用データを再販しようとして、「個人情報が売買されるのか」という強い反発を招く事態となった。
この件では一般ユーザの誤解や思い込みもあっただろう。匿名化された乗車時間帯や乗車区間などの情報は、個人を特定しプライバシーを侵害するものではなかったのではないか。それでも「なんとなく気持ち悪い」という感情への対応は求められ、説明を丁寧に行って理解を得るのか、オプトアウトにすれば良いのか、暗号化などセキュリティを厳格に行うのか、ユーザ側にメリットを提供することとのトレードオフになるのか、解決の近道があるわけではない。データ活用が進めば進むほど、医療や遺伝子情報といったセンシティブな情報の扱いも生じる。
パーソナルデータの漏えいや不正利用はもちろん大問題なのだが、同時に事業者がSuica問題のような事態を恐れて萎縮し、データを十分に活用できないことも懸念される。事業者側の観点からは、個人のデータにプロファイリングに役立つ豊富な属性情報が紐付いており、多面的に分析できることが好ましいが、トラブルを恐れてデータを削ってしまった結果、データの利便性やビジネス的な価値が落ちるということも考えられる。
トラブルが起きる背景には、個人情報保護法もある。10年前には現在のデータ活用環境は想定されていないため、パーソナルデータの利用ルールにはグレーゾーンが多くなっているのだ。
政府も対応を進めている。2013年に安倍内閣におけるIT戦略「世界最先端IT国家創造宣言」が決定されたが、個人の行動や状態に関する「パーソナルデータ」は「特に利用価値が高い」と指摘され、より利用しやすいように環境を整備すると表明している。個人情報保護法を改正しパーソナルデータ法とする方針で、2015年1月の通常国会を目指して検討が進められている。新制度の大綱案では「一定水準まで個人が特定される可能性を低減した個人データ(個人特定性低減データ)」なら本人の同意がなくても第三者に提供できるとしており、第三者機関がルール又は団体の認定等を行うことになる見通しだ。

矢野経済研究所作成

「ビッグデータ」「オープンデータ」「パーソナルデータ」は、総合的、複合的に企業経営に活かすことができる有益な情報である。オープンデータとパーソナルデータの利用環境の整備が進められているが、ルール確立とその先の活用事例・成功事例の登場が待たれる。

関連リンク

■アナリストオピニオン
ビッグデータ 3つの発展段階 ~Analytics for Everyoneへ~
ビッグデータ時代を生き抜く「データプロバイダ」という道
「ビッグデータ×スマートシティ」でビジネスチャンスをつかみとる

■同カテゴリー
[エンタープライズ]カテゴリ コンテンツ一覧

YanoICT(矢野経済研究所ICT・金融ユニット)は、お客様のご要望に合わせたオリジナル調査を無料でプランニングいたします。相談をご希望の方、ご興味をお持ちの方は、こちらからお問い合わせください。

YanoICTサイト全般に関するお問い合わせ、ご質問やご不明点がございましたら、こちらからお問い合わせください。

東京カスタマーセンター

03-5371-6901
03-5371-6970

大阪カスタマーセンター

06-6266-1382
06-6266-1422