2011/12/13

Head Firstデータ解析 頭とからだで覚えるデータ解析の基本 / Michael Milton


Head Firstデータ解析」を読みました。

内容はもうタイトルそのまんま。いわゆる「データ解析」「データ分析」の本です。

「データ解析」と一言で言ってもそのベースとなる理論はたくさんあるので、それをイチからひとつずつ押さえていくというのはなかなか大変です。この本ではそこのところをギュッとまとめて、データ解析の基本的な考え方から、統計、確率、可視化。そして、線形計画法やヒューリスティック、スプレッドシート上での具体的なデータクリーニングの方法までデータ解析の実務をスムーズに行う上で必要な知識をいいとこ取りでササッと学ばせてくれます

ちなみに、「Head First」というのはシリーズ名。ほかにも「Head First PHP&MySQL」「Head First C#」「Head First Ajax」「Head First HTML5」などなど、プログラミング言語を中心にシリーズ本がたくさん出ています。

シリーズ最大の特徴は「わかりやすさ」。「専門書は堅苦しく、わかりづらいもの」というこれまでの常識を打ち破る、画期的なデザインの本です(分野は異なりますが、この本この本なんかにも似ています)。手法としては、たとえば、目を引く人物の写真や手書き風の吹き出し、話し言葉による話しかけてくるような文章などなど。これらをふんだんに使いながら、それでいて、難しい用語や数式は最小限に抑えて、「集中力をそがれずに楽しく最後まで読めること」に最大限の注意が払われた内容となっています。

私はデータ解析については本書を読む前からある程度の知識と実務経験があるので、今回は、知識の穴を埋めること。そして、わかりやすいと噂に聞いていたHead Firstシリーズが本当にわかりやすいかを確認し、わかりやすく伝えるコツを学ぶことを目的に読みました。

読後の印象として、実際、本当にわかりやすかったです。少しクセはあるので好き嫌いが別れるかもですが、データ分析に強くなりたいマーケター、骨太な解析ができるようになりたいウェブ担当者、データ活用にいまひとつ自信が持てない経営者の方などが読むと、楽しく読めるのかなと思いました(実際に実データを使って解析してみたくなるはず!)。

以下、まとめにいきますが、今回は、あえて本の内容には直接は触れず、Head Firstシリーズに共通の「わかりやすさを高めるための工夫」に焦点をあててみました。

早速、以下から、この本から学んだ「わかりやすさのコツ」を挙げてみます。まずは、「伝える側」にできること6つ。

わかりやすさを高めるために「伝える側」にできること

#1 ビジュアルを使う
・文章だけの説明より、絵や写真を使った説明をする
・モノよりも人物の写真を使う

#2 反復する
・同じことを繰り返し説明する

#3 単体ではなくネットワークで覚えさせる
・同じことをさまざまな表現や素材を使って表現する
・左脳と右脳の両方を使わせる

#4 感情に訴える
・ストーリーで語る
・概念と絵や写真を予想外の方法で使う
・感情豊かに読めるような表現を入れる
・絵や写真に人物を入れる(目線も読者向きで)

#5 主体性を引き出す
・話しかけるような文体を使う
・練習問題を入れる

#6 余計な負担を軽減する
・難しい専門用語などで脳細胞を余計に使わせない

伝える側にできることは以上です。これだけでもおなかいっぱいなぐらい抱負にありますが、もう一方の「学ぶ側」にできることのヒントもたくさん載っています。

わかりやすさを高めるために「学ぶ側」にできること

#1 じっくり読んで脳に深く考えさせる
内容を「知る」「理解する」だけであれば、流し読みでも速読でも大丈夫ですが、その知識を実務で主体的に使えるようにするためには「じっくり」「考える」ことが必要です。

#2 実際に問題を解く
よく言われる表現ですが、陸の上で泳ぎ方をどれだけ学んでも、実際に水に浸かって泳いでみないと泳げるようにはなりません。ケースでもいいので、実際に問題を解いてみることが大事です。

#4 本書を読んだ後寝るまで他の本を読まない
これは目からウロコでした。筋肉がトレーニングの後の超回復によって育つのと同じように、脳にも、本を読んだ後の休息が必要なのかもしれません。寝る直前の気持ちや考えていたことが大事、という話も聞くので、これは実は大事なポイントかも。

#5 声に出して読む
これは昔から言われることですが、大人になるとなかなかやりません。いつもいつもやる必要はありませんが、学習がうまく進まないときには声に出してみるのもひとつですね。

#6 勉強するときのコンディションを整える
生理的、情緒的にストレスの少ない環境で、フローに入れるような環境で勉強することが大切です。水分をたっぷりと摂って脳が活性化する、というのもひとつです。

#7 脳に耳を傾ける
脳が喜んでいるのか、負担を感じているのか。その状態によってわかりやすさは大きく変わってきます。ムリな詰め込みやオーバーワークは禁物です。

#8 豊かな感情を持つ
紙面をただ目で追うだけでなく、面白がったり、驚いたり、笑ったり、突っ込んだりしながら読むことで、脳はより活性化します。

・・・以上です。

伝える側、学ぶ側のどちらに立つにせよ、「わかりやすさ」を高めるために大切なのは、人間の特性――視覚、脳、感情、記憶、学習、集中力、休息に関係するもの――をできるだけ考慮して、それに沿ったスタイルやパーツを使う使うことのようです。実際、作り手の狙いどおりにわかりやすくなっていて驚きました。


一言感想

今回は本書のコンテンツ(「データ解析」)ではなく、スタイル(わかりやすさを高めるためのコツ)に焦点をあてましたが、本書は、データ解析について学ぶのにも、スタイルを学ぶのにも使えるイイ感じの一冊でした。

結構クセはありますが、そこが気にならなければとてもおすすめな本です(ダメな人もいるかと思うので、まずはAmazonのなか見検索などでパラパラっと読んでみるのをおすすめします)。

最後に、目次とキーワードを少し載せておきます。


目次
序章
1章 データ解析入門:分析する
2章 実験:持論を検証する
3章 最適化:最大にする
4章 データの可視化:図を使うと賢くなる
5章 仮説検定:否定する
6章 ベイズ統計:基準を活用する
7章 主観確率:数値で表した信念
8章 経験則:人間らしい解析
9章 ヒストグラム:数値の形状
10章 回帰:予測
11章 誤差:誤差を適切に示す
12章 リレーショナルデータベース:関連付けられますか?
13章 データクリーニング:秩序を与える
付録1 未収録事項:上位10個のトピック
付録2 Rのインストール:Rを起動する!
付録3 Excel分析ツールのインストール:分析ツール

キーワード(自分用メモ)
  • メンタルモデル
  • データ解析の基本ステップ:定義→分解→評価→判断
  • 比較対照
  • 基準となる仮定
  • 不確定要素の特定
  • 交絡因子(confounder)
  • 探索的データ解析(exploratory data analysis:EDA)
  • 回帰分析(regression analysis)
  • 診断性
  • ヒューリスティック

おまけ
英語ですが、Head Firstシリーズの公式ページにはコンセプトも載っています。
About - Head First Labs

0 件のコメント: