コラムバックナンバー
株式会社Rejoui 菅 由紀子
発信元:メールマガジン2021年9月22日号より
かつては高度なプログラミング能力や高額なソフトウェアを持っていなければ行えなかった様々なデータ解析の手法も、様々な企業から提供されているAPIやその利用のためのプラットフォームを用いる事によって、非常に身近に利用できるようになりました。特に、映像・音声・画像・位置情報といった非構造化データの認識や検知については、深層学習系のアルゴリズムを用いた様々なAPIが提供されており、利用できる量や機能に制約はあっても、無料で試すことのできる範囲も初学者が試すには十分すぎるほどのものが提供されています。
始めなければならないとは意識していても、どうも敷居が高く感じてしまい、なかなか手を出せないという方も多いのではないかと思います。その理由としてプログラミングを始める心理的な障壁、そして機械学習のモデルを形作る数理基礎を理解する心理的な障壁があるのではないでしょうか。もちろん”簡単”とは言い切れませんが、始めの一歩として行えることを紹介したいと思います。
プログラミング第一歩:Google アカウントでPythonを始める
Googleが提供しているColaboratoryというサービスがあります。これはブラウザから Pythonを記述、実行できるサービスで、Pythonを実行するための環境構築が不要です。Googleアカウントを作成し、ブラウザでアクセスするだけで利用することができます。高速に処理を行える GPUも設定されており、たいへん有用なサービスです。Googleの提供しているサービスであるため、Googleの様々なサービスと連携して利用できることも大きなメリットです。システム開発を行うのではなく、画像認識や音声認識を実行したり、データから法則性を見出したり、パターンを検出したり、予測を実行する処理を行う目的においては、この環境で十分ではないかと思います。
数理基礎の理解第一歩:最小二乗法とユークリッド距離を理解するところから始める
機械学習の手法には様々なものがありますが、過去のデータから未来を予測することを目的とした”回帰”を行う手法として、単回帰分析、重回帰分析がまずはスタート地点になります。これを理解するためには”予測の数式で求めた場合の誤差を最小にする”、最小二乗法という考え方を学ぶことになります。これはきちんと数式を解いていけば中学程度の数学で理解ができるものです。同様に、分類問題のスタート地点となるSVM(Support Vector Machine、サポートベクターマシン)および似ているものをいくつかのグループに分けるクラスター分析などは、2地点間の距離を測る計算が行われます。これはベーシックなものとしてユークリッド距離が用いられますが、これは中学数学で学ぶ「三平方の定理」で理解が可能です。
理系バックグラウンドでない方や、プログラミングに親しみのない方々には心理的な障壁はあるかもしれませんが、Googleアカウントを作成することや中学生で学んだ数学で基礎的なことを学んでいけるのです。AIも普及期に入っており、その根幹的な技術のひとつである機械学習を始めることは解析者にとって非常に大きなメリットがあることは確かです。ぜひこれらの第一歩から始めていただければと思います。
次回は、これらに役立つ教材をご紹介したいと思います。
株式会社サイバーエージェント、株式会社ALBERTを経て、2016年に株式会社Rejouiを設立。DX推進支援、データ分析・利活用コンサルティング、データサイエンス教育事業などを展開。
統計ソフトRやPythonを活用した分析入門講座をはじめ、学生、企業、官公庁へ向けた統計・データサイエンス学習講座を提供。日本行動計量学会、WiDS TOKYO @ YCU、日本RNAi研究会等、数々の学会およびシンポジウムに登壇。自身がアンバサダーを務める人材育成の活動(WiDS HIROSHIMA)が評価を受け、2021年度日本統計学会統計教育賞受賞。
2024/05/23(木)
オンラインセミナー「今日から使えるヒートマップ超入門 ~読み解き方、ページ改善~」|2024/5/23(木)
Microsoft ClarityやUser Heatなど無料で使えるツールもあり、気軽な感覚で導入が増えているヒートマップ。導入はしたもの …
2024/04/11(木)
オンラインセミナー「GA4レベルアップ!「探索」徹底解説と「BigQuery」活用法」|2024/4/11(木)
本ウェビナーは「GA4には少し慣れてきたが、まだまだ活用できていない」「探索を使いこなしたり、BigQueryとの連携活用にもチャレンジして …
2024/03/14(木)
オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木)
本ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …
【コラム】測定への執着によって大切なものを見落としていないか
Yuwai株式会社 田中 広樹初めましてのかたも、二度目まして以上のかたもこんにちは、Yuwai株式会社の田中と申します。 運用型広告のコンサルティングを主とし、事業主の …
【コラム】車座分析のススメ サイト改善のよいタスクチームが組めるか?
アナリティクスアソシエーション 大内 範行前回は「広告予算再考」と題して「どんぶり勘定のススメ」について書きました。ただ、状況が悪化しているとはいえ、それでも広告は各プラットフォーム …
【コラム】ユニバーサルアナリティクス より自由度が高くなったことによる GA4 の弊害
株式会社JADE 村山 佑介こんにちは、株式会社JADEの村山です。過去にはa2iのセミナーで数回、Googleアナリティクス についてのセミナー等に登壇をさせていただ …