目次
第1章 基礎編 ●データを見る
それ、ほんとう? まず元データに当たる習慣をつけよう!
1 生データを入手する
*それホント? まず、生データに当たれ!
*数学ができる=年収が高い?
*自分にとって重要な数字を頭に入れておく
*アメリカ・ベンチャービジネスの幻想
2 データを図にする
*データを時系列のグラフにするとよくわかる
・検証 若者の読書離れはほんとうか?
*本はほんとうに売れなくなっているのか?
*インターネットは本の敵?
*読書離れしていない若者とは?
*昔と今の大学生はイコールではない
*結局、読書離れしているのはだれか?
*それでも本は読まれている
・検証 小泉改革は格差を拡大したのか?
*格差を測るものさし ジニ係数とローレンツ曲線
*公式統計を見る1 日本のジニ係数からの検証
*公式統計を見る2 完全失業率からの検証
*公式統計を見る3 非正規雇用のデータからの検証
*データ集めのむずかしさ1 新しすぎる概念〈ワーキングプア〉
*データ集めのむずかしさ2 データの信頼性という問題〈生活保護〉
*データ集めのむずかしさ3 数えきれない数〈ホームレスとネットカフェ難民〉
*国の豊かさを測る1 平均給与
*国の豊かさを測る2 1人当たり実質GDP
*国の豊かさを測る3 貯蓄ゼロの世帯
*検証結果をまとめる
*ジニ係数は万能ではない
*私見─右肩下がりの時代に
・検証 連続する事件や事故に関係があるのか?
*似たようなニュースが続く理由
*航空機事故は流行るのか?
*地震は続く−ポアソン分布の怪
*すべての事件に物語があるわけではない
3 専門外のデータはこうして読もう
*バイオ燃料が地球を救う?
*木を見て森も見る
第2章 中級編 ●データを読む
統計の基本を知って、正しく読もう
1 基本をおさえる─平均と分散
*「平均」値が実感と合わないのはなぜ?
*庶民とお金持ちはここが違う
*株価の動きは読めるのか
*株価の動きに規則性はあるのか、ないのか?
*中学数学でわかる標準偏差
*標準偏差はなぜ2乗してルートを取るのか
2 足したら出てくる―正規分布
*ゆがみにご注意−ワイブル分布
3 一を聞いて十を知る―大数の法則
*なぜ、開票率数%で、「当確」が出るのか?
*アンケートは偏ることもある
4 分けて考えるべき分布
*奇跡の公式−ブラック・ショールズ評価式
*分けて考えるべき分布
*平均・分散が存在しない世界
*安全な資産運用は幻想である
5 因果関係と間違えるな―相関
*勉強が好きなら成績もいい?
*勉強時間が増えれば成績が上がる?
*「相関が高い」と言えるとき、言えないとき
*相関係数は曲がったことが嫌い
*関係ないのに相関係数が高い話
第3章 上級編 ●データを利用する
過去データから未来を予測する
1 未来を予測する
*経済予測はなぜプロでもむずかしいのか?
*ブラック・スワン
*人口はわたしたちに未来を語りかけている
*失業率のニュースをどうとらえるか?
*日本の出生率は上がるのか?
*人口ピラミッドで日本のこれからを読む
*中国の繁栄はいつまで続くのか
2 思考を練磨する オープンコラボレーション
*ロジカルな議論の実践−共産党の国会質問
3 自力で考えることの最大の敵
(ディスカヴァー・トゥエンティワン社HPから引用させていただきました)
◆本書を読む視点◆
・統計思考をどのように使いこなせばよいのか
◆本書を一言で表すと◆
・統計思考に親しむための指南本
◆概要&感想◆
統計的に物事を見て、考える。
そんな統計思考の世界へと続く玄関のドアのような本です。
とにかくわかりやすく、丁寧にデータと統計について書かれています。
本書の特徴として、著者もブログなど様々なところで書かれていますがとにかく数式が出てきません。
統計というとどうしても数式と切り離せないところを、あえていかに数式を使わずにその考え方やアプローチを伝えるか、が本書のテーマ。
そういう意味では、過去に類を見ない統計の本だと言うことができると思います。
そしてこの数式が出ないことで、グッと読む側のハードルが下がっています。
第1章では、「データを見る」ことでいかに普段なんとなく考えていることが曖昧かがわかるようになっています。
馴染みの深い事象をいくつも取り上げて、それを「データ」という事実から検証されており、心地よさすらあります。
検証という実例の中で、データの見方を解説されているので、どのような場面で、どのようにデータを見るべきかがわかるようになっています。
そして個人的に良かったのは第2章。
「データを読む」と題して、具体的にデータをどのように読む(= 捉える)のか、統計手法の解説と併せて書かれています。
統計手法として余りにも有名な、平均や分散、正規分布とべき分布、そして相関というよく名前は聞くけれども実際に使いこなせているとは言い難い基本的なものにだけ焦点を当てています。
特に分散と相関についての説明は非常にわかりやすかったです。
事例を踏まえつつ、細かい疑問に思う点も解き明かしてくれているため、スッキリとしながら読めます。
本書を読むことでわかること。
それは、まず「データを見る」ことでいろいろと見えていなかったことが見えるようになる、ということ。
次に、「データを読む」のに必要なツール(平均や分散、分布、相関)を使うにあたっての考え方が整理され、抵抗感が無くなります。
何より、データを使ってみよう、とか見てみよう、と思うようになると思います。
そのとっかかりに最適な一冊かと。
仕事をするなどの中で、データを見たり、読んだり、使うことの利点は、自分の主観を抜きにして客観的に物事を見れることだと思います。
そしてその客観的な見方というのは、本書の冒頭にあるとおり、
データは、議論のための共通言語
になるのだと思います。
統計思考をどのように使いこなせばよいのか、ということに対しては、
@データの見方を身につける(=見るための型をいくつか用意する)
Aデータを読むためのツールが自然と選択肢として出てくるようにする
B常にデータとして読むクセを身につける
ということではないか、と。
本書内でも引用されている「ブログ論壇の誕生」にあった
きちんと議論をオープンにし、すべてを可視化させ、真摯に対応していくしかないのだ。
の可視化の部分のためにも今後データはますます必要となっていくはず。
その入門編として最適な一冊かと。
個人的には、中級編を抜き出して、実際のトレーニングをやりたいなぁ、と感じました。
各章それぞれを独立させた一冊の本にしても良いとも思います。
よりクローズアップした次の一冊にもぜひ期待したいところです。
◆気になったポイント◆
@データを先に見る
Aだれかが解釈する前のデータを見る
B自分の仮説に反するデータも集める
ものごとを見るためのポイントとして覚えておきます。
まずは、データを見て、数字をざっくり頭に入れておく
そう言われてみると、自分の頭の中には驚くほど数字が入っていないですね…
意識しなければ…
データを見る際に陥りがちな間違いは、一部だけを見て判断を下してしまうことです。
やりがちです。
自分の都合の良い一部に目がいってしまうことを自覚する必要があるということかと。
専門外だからと敬遠せず、いつもと違った分野のデータをのぞいてみませんか?
何か興味深いことが見つかるかもしれません。
データの特徴を表すうえで、平均値を使うのが適切かどうか
平均って便利なのでよく使われますし、ついつい使ってしまいますが、そもそもまず前段で適切かどうかを考える必要がある、と。
「相関」というのは、あくまで「対応関係」を示したものであって、「因果関係」ではない
これも混同しがちですね。。
「なんでもグラフにしてみる」精神
統計思考力を鍛える第一歩として持っておこうかと。
現在は、さまざまな統計情報がオープンになっています。
それらのデータを活用して、エビデンス・ベーストな(証拠に基づいた)議論をすること、これこそが民主主義、ではないでしょうか。
「ブログ論壇の誕生」と通じることですね。
日本人が苦手な部分であり、これからより一層必要とされるポイントだと思います。
おそらく、自力で考えることの最大の敵は、自分にはわかっているという過信です。
いちばんむずかしいのは、正気を保つことなのです。
正気を保つために、データ分析ほど強力な薬はほかにないでしょう。
自力で考える+データ分析で裏付ける、という両輪で考えるクセをつけなければなりませんね。
◆これからやること◆
・まずデータから見てみる
・元データが何かを意識してデータを見る
・データを扱う時にはなんでもグラフにしてみる
・常日頃からデータを見る癖をつけて、ざっくりと頭に入れておく
・「平均」や「分散」、「相関」についてどのように使われているのかを意識して見る
◆オススメしたい方◆
・「統計」「分析」って何?という方
・統計って大事そうだけど難しそう…という方
・データの取り扱いの基本を学びたい方
・データとうまく付き合いたい方
■関連リンク■
・本書紹介ページ(ディスカヴァー・トゥエンティワン社HP内)
・「統計思考力」キャンペーンサイト(ディスカヴァー・トゥエンティワン社HP内)
・Masahiro KAMINAGA Japanese Page(著者 神永正博氏公式HP)
・Masahiro
Kaminaga's Weblog(著者 神永正博氏公式ブログ)
■関連過去エントリ■
・[Book]ブログ論壇の誕生 (文春新書)