Digital, digital and digital

デジタルについてトッププロファーム勤務の藤谷が書き綴ります。

統計 - それは誰もが見逃してしまいがちなサブスキルの参謀 (3/)

引き続き数学スキル、特に統計について書いていきます。サブスキルの参謀ですね

参考記事
統計 - それは誰もが見逃してしまいがちなサブスキルの参謀 (1/)
http://touya-fujitani.blogspot.com/2020/04/stascticsdatascience.html


前回の記事を書いた際に読者の方から指摘を頂いてなるほどと思ったことがあります、数学をスキルとして伸ばしてもData scientistの転職以外でのメリットが感じられないという指摘です。

ただ前回の記事でも書いたように数学、特に統計学
数字データというものを、どのように分析し、どのような判断を下したらよいかを論ずる学問です。大凡、社会人たるもの数字データは扱います。だから本来みんなに役立つ、みんなの為のものなのです。価値を生み出すボリュームゾーンは基礎的なところが分かってるというところにあります。Top data scientistだけ見て圧倒されてしまい統計の学習をしないのは、英語でSpeakingの道のりが遠すぎてReadingを放棄するのに似ています。英語でもどのスキルの価値のボリュームが一番大きいかと言われたら、そりゃReadingなのです。
 
そんな中で、ぼくがこんな本が必要だなと思っていた本当に良い本が出されていました。


データ分析のための数理モデル入門 本質をとらえた分析のために
https://amzn.to/2EOSBSt


https://amzn.to/2EOSBSt

著者の江崎さんは、東京大学先端科学技術研究センター特任講師。東京大学工学部航空宇宙工学科卒業、同大学院博士課程修了(特例適用により1年短縮)、博士(工学)。日本学術振興会特別研究員、国立情報学研究所特任研究員、JSTさきがけ研究員、スタンフォード大学客員研究員を経て、2020年より現職。東京大学総長賞、井上研究奨励賞など受賞、、、ということで、もうなんだかとにかくてんこ盛りですね。

 
ところで本書でぼくに非常に響いたページがあります、このページです。
---

 
出典:データ分析のための数理モデル入門 本質をとらえた分析のために
https://amzn.to/2EOSBSt
---
ここのページで記載されているように、「データをありのままの姿を見る」から「データに沿った数理モデルによる方法」に遷移するだけで物凄く価値が出るというのがぼくが思っていたことです。「仮定=数理モデル」というのは、大枠で「仮説」として捉えることも出来るかと思います。対象=データに対して「仮説」が使えるか使えないかというのは、分析というか思考そのものに大きな価値の差が出ます

特に記載されているここの3点が出来るかどうかで、データから生み出せる価値が俄然変わってきます。ぼくが思っていた価値のボリュームゾーンはここです。特にコンサルタントでも3が出来ない方が多いですが、ここをちょっと頑張るのは非常に投資対効果が高いです
--
  1. 現象のメカニズムを客観的な方法で理解する
  2. データから未来のことを予測する
  3. コンピューターに高度なデータ処理・データ生成をやらせる
出典:データ分析のための数理モデル入門 本質をとらえた分析のために
https://amzn.to/2EOSBSt
---

あんまりお手軽なアプローチでもイケてませんが、かといってガチ過ぎるとやっぱり万人向けにはなり得ません。ここがsweat spotになっているなあと思います。ちなみに、各テーマをより掘り下げるのに良質な基礎書は下記です
--
  1. データ分析の力 因果関係に迫る思考法
    https://amzn.to/2oreFqD
  2. 現場ですぐ使える時系列データ分析~データサイエンティストのための基礎知識~https://amzn.to/3foBUtt
  3. Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎https://amzn.to/3ftTwnI
--
 
要は、top data scientistになろう!とかではなくて、普通のビジネスマンの方が日常的な会議で出すExcelでの分析をちょっとアップグレードするだけで物凄く価値が出るんじゃないかと思います。その為にちょっと数学、特に統計・Pythonを勉強するといいんじゃないかなあと感じることが多いです。やってみてガチ勢に行きたくなったら今は環境は整っています。

参考記事
Statistics and Data Science from MIT - Probability - The Science of Uncertainty and Data (10/) 
 https://touya-fujitani.blogspot.com/2018/12/statistics-and-data-science-from-mit.html
 
ただやっぱり全体像を掴めないとモチベーションが湧かないというのが人間というものです。本書は全体像を分かりやすく提示した上で、各テーマのエッセンスまで超良質な説明をしてくれているのでおすすめです。やっぱり良い教科書は「言葉の定義が良い」と思います。ここの説明とかいいなあと思います

--
「データをうまく説明する数理モデルは、データの生成過程をある程度捉えているだろうから、その数理モデルを調べてやれば理解に繋がるはずである」
 
出典:データ分析のための数理モデル入門 本質をとらえた分析のために
https://amzn.to/2EOSBSt
---
 
機械学習モデリングの一分野に過ぎないということが自然に分かりますし、個人的には  "第四部 数理モデルを作る" とてもおすすめです。やっぱりそもそも数理モデルってこういうものなんだという感覚を掴んだ上で、数学の勉強をすると馬力が違う気がします。
 
それにしても最近、大学生の頃に学んだことの復習のようなことばかりしていて、しかもほとんどを忘れてしまっているので、「何かこれ、、やったな確か」みたいなことを思う度に複雑な気分になってしまうのですが、数学スキルの重要性を思うばかりなので攻めの一手ですね。
 
しかし本書は説明が良いです。DSで重要になる基礎概念・用語は網羅されているので初手の1冊として決定版が出たなと思っています。

参考書籍
データ分析のための数理モデル入門 本質をとらえた分析のために
https://amzn.to/2EOSBSt

関連記事
企業価値評価の名著 - たった5冊で十分過ぎるといつも思う
https://touya-fujitani.blogspot.com/2018/08/5.html