コラムバックナンバー
Option合同会社 柳井 隆道
発信元:メールマガジン2018年10月3日号より
◆データ分析ソフトウェアの役割
データの分析プロセスというのは、大体以下の一連のステップになります。
RやPythonであればこれをすべてプログラムを書くことによって実現するわけですが、それはハードルが高い。
マウスのドラッグ&ドロップでできるGUIのツールで、これらを担うソフトウェアがあります。
有名どころでは
SPSS Modeler
SAS Enterprise Miner
などになります。それなりに高価です。
ただこれらのツールがあればデータ分析(統計手法)の知識があればマウスのドラッグ&ドロップで簡単にデータ分析ができるのです。
マウスのドラッグ&ドロップでデータ処理の流れを作っていくソフトウェアは他にもいくつかあるのですが、最近耳にするかもしれないGoogleのCloud Dataprepは2に特化したソリューションです。つまり3以降は別のソリューションを使う必要があります。
◆オープンソースのデータ分析ツール
実はオープンソース、つまりツールの代金は無料でも、こういったコンセプトのツールがあるのです。
Orange
KNIME
いずれもさまざまな形式のデータを取り込み、データの前処理からモデルの適用をする機能までひととおり搭載されています。
前者はPythonで、後者はJavaベースでGUI化したものになり、デスクトップPCにインストールする形式ですので簡単にお試しができます。
OrangeはUIがシンプルでわかりやすく、おすすめのツールです。シンプルであることによって誰もが使いやすくなっている、そういう印象を受けます。使い方は簡単。
左のメニューからデータ分析のステップ(さまざまな前処理やモデル手法など)を選び、右のキャンバスにドラッグして矢印でつなげていきます。各ステップには手法別の設定がある(学習のチューニングパラメータや使う変数の指定など)ので、それを設定していきます。チャートを表示することもできますし、回帰分析などの手法を使うこともできます。分析フローを構築でき、かつ基本的な分析手法や機械学習のアルゴリズムは搭載しているため、比較的小さい習熟コストでデータ分析をできるおすすめのツールです。
KNIMEはより機能が多く、ハードルの高いUIになっています。まずは試しにOrangeを使ってみるのがいいでしょう。名前からして検索しにくいのでなかなか検索エンジン上で情報を見つけにくいところが弱点ですかね(Rもそうなので困りものですが)。
どんなことができるツールなのか、雰囲気はここを見るとよくわかります。
https://orange.biolab.si/screenshots/
本格的な手法も取り揃えているため、初学者にとっては必要十分であると思います。
まずはこういったツールを使えるようになり、それで満足できなくなったらより高度なツールを使う、どうしても必要であればPythonなどのプログラムを書く。それが近道ではないでしょうか。
東京大学を卒業後、webマーケティングやサービス企画、システム開発などに従事。
デジタルマーケティングの世界に落ち着き、事業会社、広告代理店を経て2014年に独立。
現在は大小さまざまの事業会社、広告代理店などに対して、テクノロジー観点からデジタルマーケティングの支援を行っている。データ計測の設計、実装から分析、マーケティングオートメーションや広告運用などの施策との連携まで扱う。
さまざまな規模の経験から、企業の身の丈にあったデジタルマーケティングの企画に強い。フリーランスで活動していたが、2017年から法人化。
2025/09/10(水)
オンラインセミナー「手間ゼロの広告レポーティングを「Looker Studio」×「Databeat」で実現する方法」|2025/9/10(水)
ツール研究会の2回目は、Databeatがテーマです。 広告データの収集から蓄積・レポート作成までを自動化できる「Databeat」の活用方 …
2025/08/27(水)
オンラインセミナー「GA4のセグメントで分析が変わる!探索レポート活用術」|2025/8/27(水)
このセミナーでは、Google アナリティクス 4(GA4)をより実践的に使いこなすために探索レポートのセグメント機能を基礎から活用術まで学 …
2025/07/16(水)
オンラインセミナー「【Canva入門 for マーケ担当者】広告・解析レポートをサクッと伝わるデザインにしてみよう!」|2025/7/16(水)
2025年スタートの新企画「ツール研究会」の第一弾は、「Canva」を取りあげます。 急なバナー作成やCTA差し込み、レポート用スライド作成 …
【コラム】生成AI時代、独自性・原体験をどうコンテンツに組み込んでいくのか
株式会社A-can 白砂 ゆき子生成AIが業務に浸透することで、コンテンツ制作におけるリソース配分は大きく変わりました。以前は原稿執筆の作業時間が最も長く、次に構成、そして …
【コラム】国家の統計データは、羅針盤であり内視鏡であり私たちの鏡です
アナリティクスアソシエーション 大内 範行8月1日に米国で発表された雇用統計で、過去の就業者数が大幅に下方修正されたことがニュースで話題になりました。 「いくらなんでも変わりすぎ」と …
仕事をする上で、ピントを合わせることを大切にしている。 筆者はカメラマンではないが、普段料理や愛猫の写真をよく撮る。オートフォーカス機能のお …