コラムバックナンバー

◆データ分析ソフトウェアの役割

データの分析プロセスというのは、大体以下の一連のステップになります。

  1. データの取り込み:CSVなどのファイルや、データベースからデータを直接取り込む
  2. 前処理:入力ミスなどの訂正や、連続量のカテゴリ化、欠損処理など、データをまともに分析できるように加工する
  3. 可視化:さまざまな変数の組み合わせをとりあえずプロットして傾向を把握する。Tableauなどで可視化するのはこの位置づけになる
  4. モデルの構築:現状(今あるデータ)の解釈や将来の予測をできるようにするため、データの構造を数式化する。回帰分析やランダムフォレストなど、いわゆる統計手法や機械学習の手法にかけるのがこれにあたる
  5. モデルの評価:構築したモデルが実際に使えるものなのか、モデルが出した結果を実際のデータと照らし合わせて検証する。複数のモデルを構築し、それらの精度を比較してベストのモデルを採択することが多い。
  6. 採択されたモデルを使う:回帰係数を評価して解釈する、予測を行う

RやPythonであればこれをすべてプログラムを書くことによって実現するわけですが、それはハードルが高い。
マウスのドラッグ&ドロップでできるGUIのツールで、これらを担うソフトウェアがあります。

有名どころでは
SPSS Modeler
SAS Enterprise Miner

などになります。それなりに高価です。
ただこれらのツールがあればデータ分析(統計手法)の知識があればマウスのドラッグ&ドロップで簡単にデータ分析ができるのです。

マウスのドラッグ&ドロップでデータ処理の流れを作っていくソフトウェアは他にもいくつかあるのですが、最近耳にするかもしれないGoogleのCloud Dataprepは2に特化したソリューションです。つまり3以降は別のソリューションを使う必要があります。

◆オープンソースのデータ分析ツール

実はオープンソース、つまりツールの代金は無料でも、こういったコンセプトのツールがあるのです。
Orange
KNIME

いずれもさまざまな形式のデータを取り込み、データの前処理からモデルの適用をする機能までひととおり搭載されています。
前者はPythonで、後者はJavaベースでGUI化したものになり、デスクトップPCにインストールする形式ですので簡単にお試しができます。

OrangeはUIがシンプルでわかりやすく、おすすめのツールです。シンプルであることによって誰もが使いやすくなっている、そういう印象を受けます。使い方は簡単。
左のメニューからデータ分析のステップ(さまざまな前処理やモデル手法など)を選び、右のキャンバスにドラッグして矢印でつなげていきます。各ステップには手法別の設定がある(学習のチューニングパラメータや使う変数の指定など)ので、それを設定していきます。チャートを表示することもできますし、回帰分析などの手法を使うこともできます。分析フローを構築でき、かつ基本的な分析手法や機械学習のアルゴリズムは搭載しているため、比較的小さい習熟コストでデータ分析をできるおすすめのツールです。
KNIMEはより機能が多く、ハードルの高いUIになっています。まずは試しにOrangeを使ってみるのがいいでしょう。名前からして検索しにくいのでなかなか検索エンジン上で情報を見つけにくいところが弱点ですかね(Rもそうなので困りものですが)。
どんなことができるツールなのか、雰囲気はここを見るとよくわかります。
https://orange.biolab.si/screenshots/

本格的な手法も取り揃えているため、初学者にとっては必要十分であると思います。
まずはこういったツールを使えるようになり、それで満足できなくなったらより高度なツールを使う、どうしても必要であればPythonなどのプログラムを書く。それが近道ではないでしょうか。

コラム担当スタッフ

柳井 隆道

Option合同会社
代表社員
マーケティングテクノロジスト
marketechlabo

東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。

一つ前のページに戻る

a2i セミナー風景イメージ

あなたも参加しませんか?

「アナリティクス アソシエーション」は、アナリティクスに取り組む皆さまの活躍をサポートします。会員登録いただいた方には、セミナー・イベント情報や業界の関連ニュースをいち早くお届けしています。

セミナー・イベント予定

予定一覧へ

コラムバックナンバー

  • 【コラム】A/Bテストの多くは刹那的なものだということに気づくべきだ

    株式会社真摯 いちしま 泰樹
    発信元:メールマガジン2018年12月5日号より

    「A/Bテストを重ねていけば、結果として数字はずっと良くなっていることになる」という謎理論は誰が言い始めたのでしょう。 Webサイトやアプリ …

  • 【コラム】データ分析とデータドリブンマーケティング

    Option合同会社 柳井 隆道
    発信元:メールマガジン2018年11月28日号より

    よく「分析のアウトプットは次の行動につながらないといけない」と言われます。果たしてそんな必要はあるのか、もやもや感じることがあります。分析は …

  • 【コラム】女性こそデータ分析のスキルを

    株式会社Rejoui 菅 由紀子
    発信元:メールマガジン2018年11月14日号より

    前回のコラムでは「近年のデータ分析業界の変化について考える」と題し、私自身が起業して以降2年間で感じた変化について寄稿いたしました。 前回の …

バックナンバー一覧へ