2020年4月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    

最近のコメント

最近のトラックバック

無料ブログはココログ

« 2019年7月 | トップページ | 2019年9月 »

2019年8月

2019年8月31日 (土)

「10年戦えるデータ分析入門」(青木峰郎著)を読んでの感想・書評

データ分析を頼まれた関係で「10年戦えるデータ分析入門」(青木峰郎著 SBクリエイティブ)を読んでみました。

本書の副題に「SQLを武器にデータ活用時代を生き抜く」とあるように、SQL文でどのようにデータ分析するかが、載っています。
SQL文の説明も結構な割合で含まれていますので、SQL文を作ったことが無い人でも、読めると思います。

また、サブクエリ(副問合せ)やウィンドウ関数、問い合わせ結果の縦横変換といった、データベースを扱うエンジニアでも対象の業務分野によっては、苦手そうな内容も含まれています。

使用するデータベースはPostgreSQLなので、これをインストールして読んでいった方が良いです。
PostgreSQLはOSS(オープンソースソフトウェア)なので、無料で使用できます。

データベース(DB)は、SQL文の違い(私は説明するのに、訛り、方言なんか言っています)があるので、他のデータベースでは、その違いによりサンプルがエラーになるからです。

本書の中では、下記のような良く使われる分析方法が説明されています。

  • クロス集計
  • バスケット分析(どの商品が一緒に買われやすいか分析する)
  • デシル分析(購入金額の順に顧客を人数ベースで10分割する分析)
  • 時系列データの分析で移動平均法
  • アクセスログのセッション分析

この辺りは、自分が必要としている内容を詳しく読むや「やってみる」などでも良いかと思います。

後半は、データウェアハウス(DWH)の構築や企業全体の分析について説明されたりとなっています。

著者の方もSQL文の説明から後半部分まで1冊にまとめたことを「暴挙」と書いていましたが、細かい内容を知りたかったら別の書籍を読んだ方が良さそうです。
その辺りは、参考文献を細かく掲載されているので、それらを読んだ方が良さそうです。

あくまで、この本は分析の入り口(入門)と考えた方が良いかと思います。

« 2019年7月 | トップページ | 2019年9月 »