矢野経済研究所 ICT・金融ユニット

アナリストオピニオン
2013.06.14

解析ってなんだ?

ビッグデータで盛り上がる解析の世界

ビッグデータで急に注目を浴びたのが、データの解析や分析である。矢野経済研究所でも、ビッグデータという言葉が登場するとともに調査を開始し、2012年4月には『2012 ビッグデータ市場-将来性と参入企業の戦略-』としてレポートも発刊した。そこでも実際のビジネスとして先行しているのは、解析系のビジネスであった。

また、最近はデータ解析関連の本がベストセラーに名を連ねるなど、注目度は高い。ビッグデータという全体をくるむようなキーワードが少し落ち着き、その中身が徐々にカテゴライズされている最中、というのが現在なのであろう。

そして当社もまさにカテゴリを整理しつつ、同分野をいかに認識しようかと手探りしているところである。その結果は『2013 解析・分析ソリューション市場の展望 -ビッグデータ時代の注目市場-』というタイトルで2013年6月末~7月初旬に発刊予定であるが、いまちょうど、その取材活動中となっている。

企画した背景には、複数の企業から、“統計解析ではビッグデータは不要である”“ビッグデータがあれば宝が見つかるなどと思わないでほしい”といった声をきいたことがある。
つまりは解析系の専門家からいわせれば、ビッグデータというバズワードにすぎず、ビッグデータブームだからといって、これまでやってきたことが大きく変わるものではない、というのである。

なるほど、とは思いつつも、ふと、そもそも統計・解析・分析といった分野にはどのような市場があるのか分からないことに気が付いた。もちろん現状がわからなければ、その市場がビッグデータによりどのような影響を受けるのかわかるはずもない。こうして、解析系ソリューションの調査レポートの企画がはじまったのである。

実際、ビッグデータを“解析”し、といっても中身は多様だ。ビッグデータから有意な結果を統計解析ツールを使って発見する、というような表現はよく耳にする。また、気象庁は大量なデータを解析して天気予報をしており昔からビッグデータを使っていた、というような主旨の表現も見かける。関連するキーワードを抜き出しても、データマイニング、統計解析、数値解析、構造解析、構文分析…などと「解析・分析」の用語が氾濫しており、専門家でも俯瞰した理解ができている人は少ない。ましてや一般の文系人間にはなにがなんだか、、、というのが実態であろう(筆者もその一人である)。

ここでは、解析・分析の用語の整理をすることで、当該分野の理解を深める一助になればと思う。

■解析・分析市場の整理

整理にあたって専門家とも意見交換したが、どうも統一された分類基準というものは存在していないようだ。下記は今回の調査活動を経て弊社で整理した分類である。明確な基準はないため、専門家によっては異なる意見もありうる点に注意いただきたい。

◆数値解析・数式処理
□数式処理
□数値解析
□応用数値解析
●数理計画法、シミュレーション、CAEなど
◆統計解析
●記述統計
●推測統計
◆(データ)マイニング
●データマイニング
●テキストマイニング

 

◆数値解析・数式処理

数値解析は、「数学および物理学の一分野で、代数的に解を得ることが不可能な解析学上の問題を近似的に解く手法に関する学問」(Wikipedia)である。例えば円の面積は「A=πr^2」という式で表現できるとしても、実際上は具体的な数値として求める必要も生じる。このときπは3.14・・・と無限につづくため、正確な数値を求めることはできないが、近似解を求めることはできる。こうした取り組みを数値解析、そしてそのために利用するソフトウェア類を数値解析ソフトウェアと呼ぶ。この中には、数理計画法 やシミュレーションなどに関するソフトウェアも該当する。また、数値計算とは、モデル化などにより得られた数学の問題の近似解(数値解)を計算機によって求めることをいう。数値計算を支える数学的理論が数値解析である。代表的な数値解析システムには、Matlabがある。

一方、数式処理は、科学技術計算において、数式のまま記号的に処理しようとする概念である。上述した数値解析では、近似解を求めることはできるが、その誤差が許容できないケースも多い。そのため数式処理システムを用いて、代数的な規則に基づいた処理を行おうとするのが数式処理である。商用システムとして代表的なものにMathematicaとMapleがある。

また、応用数値解析として、数理計画法、シミュレーション、CAEなどを位置付けた。エンジニアリング領域で使われる構造解析、流体解析などはこの分野に含まれる。

◆統計解析

統計解析は、統計学を用いた解析を指す。統計学という観点でみると、大きく、記述統計学と推測統計学に分類される。

記述統計学:所与の統計データ(ある標識に関する数値の集合)そのものの特徴を、平均値、標準偏差、最頻値、中央値、相関係数などの数量的尺度を用いて、要約的に記述するもの
推測統計学:統計的データを、元になる集団(母集団)から抽出され観測のたびに異なる値を取りうる標本の一例と見て、すなわち特定の確率分布に従う確率変数の実現値とみて、得られたデータから母集団分布に対して推論を行うことを目的とするもの(『新社会学事典』有斐閣)

分かりやすく書くと、記述統計学は調査や実験で集めたデータを整理し、集計表やグラフなどにすること、といえる。また、推測統計学は収集した一部のデータから、母集団全体の傾向などを推し量ること、ということができる。

◆データマイニング

データマイニングは、歴史は浅く、「有用でかつ既知でない知識をデータから抽出する自明でない一連の手続き」と定義されている。データの山の名から、何らかの有効な関連性を見出そうとする取り組みを指している。データがテキスト形式の場合は、テキストマイニングとしてデータマイニングと区別することも多い。
数値解析や統計解析が学問として研究されているのに対し、データマイニングはビジネスにおいて進化してきたといえるだろう。また、データマイニングにとって、数値解析や統計解析は道具となっている。そのため、マイニングソフトは数値計算や統計など多様な内容を含んだものとなっている。

似ているようで微妙に違うさまざまな解析アプローチ

まず、大きく分けると、「統計解析とデータマイニング」と「数値解析・数式処理」との違いを見出すことができる。これはITとの相性の問題としても現れる。例えば、昨今注目されている分散処理技術などはどうであろうか。統計解析・データマイニングにおいては、分散処理技術が処理能力の向上に大きく寄与している。ところが数値解析ではそうとはいえない。
簡単にいえば、数値解析は複雑な連立一次方程式の計算をコンピュータにやらせることになる。その場合のコンピュータとは、HPC(スパコン)を指向するものである。分散処理を行っても、効果は上がりにくいのである。
具体的にいえば、天気予報などがそうだ。気象データなどの分析は、メッシュを細かくするなど、特定の目的をもって、数値処理や数値計算が行われる。天気予報で活用されるデータはビッグなのは間違いないが、それを使った計算の精緻化が目的であり、分散処理などとは相性は悪い。

一方、データマイニングなどは、目的不在の状態で、なんらかのバリューを出すものである。それだけに、分析ツールも多様となっており、その都度、適切な方法を探しながら解析していくアプローチになるといえる。

では「統計解析」と「データマイニング」はどう違うのか。
統計解析が仮説検証型、データマイニングが仮説発見型と位置付けることができる。統計解析は、仮説モデルが先にあり、データで検証することで、仮説を証明する流れとなる。他方、データマイニングはデータがまずありきで、そこから金の鉱脈を発見するがごとく、探索(マイニンング)することでモデルを作り上げていく。

データマイニングは前述したように、ビジネスで生まれた概念である。よって、学問的なアプローチとことなり、かなり自由に展開されている。

ビッグデータとのかかわりでは、やはりこのデータマイニングが最も大きいが、ツールに頼るのではなく、様々なツールを使いこなそうとする能動的な姿勢が重要といえる。無論、ビジネスにも精通している必要があることから、マイニンングによりビジネスのバリューを見出すことができるというのは、かなり貴重なものといえるだろう。

忌部佳史

関連リンク

■レポートサマリー
データ分析関連人材規模に関する調査を実施(2020年)

■アナリストオピニオン
「ビッグデータ×スマートシティ」でビジネスチャンスをつかみとる
ビッグデータ時代を生き抜く「データプロバイダ」という道

■同カテゴリー
[エンタープライズ]カテゴリ コンテンツ一覧

関連マーケットレポート
忌部 佳史(インベ ヨシフミ) 理事研究員
市場環境は大胆に変化しています。その変化にどう対応していくか、何をマーケティングの課題とすべきか、企業により選択は様々です。技術動向、経済情勢など俯瞰した視野と現場の生の声に耳を傾け、未来を示していけるよう挑んでいきます。

YanoICT(矢野経済研究所ICT・金融ユニット)は、お客様のご要望に合わせたオリジナル調査を無料でプランニングいたします。相談をご希望の方、ご興味をお持ちの方は、こちらからお問い合わせください。

YanoICTサイト全般に関するお問い合わせ、ご質問やご不明点がございましたら、こちらからお問い合わせください。

東京カスタマーセンター

03-5371-6901
03-5371-6970

大阪カスタマーセンター

06-6266-1382
06-6266-1422