過去の日記

2007-02-07 [長年日記]

グラフを「正しく読む」と「正しく使う」 [etc]

棒グラフの波線省略は問題があるということを、(略)
http://q.hatena.ne.jp/1170771802

のコメント、

視覚は いくらでもだませるから 絶対に数値を読めを信念にしてます..
http://q.hatena.ne.jp/1170771802#c78433

に引っかかりを覚えていたのだけど正体が分かったので書く。
グラフを正しく読みとる、正しく使うという訓練をしないできているんだという話なんだけど……。


今年に入って統計の勉強をしている。仕事上でのミッションに、「ある施策」の効果を測定して上司に(そして上司はまたその上司に)報告する、というのがあったから。そのさなかで自分も含めて周りにいる全員が、まっとうな「統計」というスキルが全然ないことに気がついた。時系列に区間を区切って(月単位だったりするわけだ)計を出して折れ線グラフにするぐらい。
これじゃいかん! と思って図書館から本を借りて読んでみたり、Excelで実際にグラフを作ってみたり。
その中の一冊、「現場で使える統計学(豊田 裕貴)」にしつこいぐらい書いてあるのだけど、統計ってのはつまりデータから特徴を抽出することであり、同時にそれと引き替えにその他のディティールを削ぎ落とすということでもある*1
グラフを正しく読むってのは、グラフの形状から元データの特徴を読み取る、というだけじゃなくて、どんな特徴が削ぎ落とされているか? にも目を向けないといけないのだろう。
その統計はどんなデータを元にしているのか? も意識する必要がある。
それは十分に踏まえた上で、いろいろな視点でグラフを見てみるのだ。
線形に近似できるのか? n次の多項式? それとも指数関数? という様な視点もある。
グラフが急激な形状変化を示しているなら、その原因を説明するのに回帰分析してみるという手もある。
あるいは回帰分析してみたらどうもこの仮説は違うらしい、という結果が出てしまうこともあるだろう。"割れ窓理論"で有名なニューヨーク市の犯罪件数について回帰分析をしたら、実際は景気との相関の方が強いと考えられるいう話は「統計数字を疑う なぜ実感とズレるのか? (光文社新書)(門倉 貴史)」に載っていたはずだ。


話がずれた様な気がする。そういうテクニックとしての統計の話がしたかったわけじゃないんだった。
ええと。
グラフを「正しく読み取る」というのは上に書いた様な話でテクニック、技術に属することだと思う。
グラフを「正しく使う」っていうのはそれとは全然違う話だ。
それは、グラフというものは、どの様な説明(仮説付け)が可能かを直感的に判断する――言い換えると、仮説を構築する――ためにあるもので、その説明を根拠づけるものではない、ということ。
その判断、仮説、説明が正当であるかどうかをグラフに因って判断してはいけない。
ある仮説があって「ほら本当でしょ?」と言いたいときにグラフを添えること、それ自体がグラフの存在意義から外れているんじゃないのか。
回帰分析してみましたこうなりました。ここまでのデータを元に係数を予測してみました、その係数を使ってそれ以降を予測してみるとここまで当てはまりました。なんて言うよりもグラフを添えた方が判りやすいのは確かだ。
でもそのような判りやすさから、グラフを添えて説明すること、説明されることに慣れすぎてしまっているのではないか?
その慣れのせいで、まるで「グラフからこういう仮説が正しいことが判ります」という説明が正当であるという錯覚を起こしてしまっているのではないか?


で、これはグラフの図形だけの話じゃない。
グラフに添えられた数字だけを見て判断してももちろん駄目なのだ。
それはすでに統計的な操作を加えられた「ある特徴」でしかない。
上に書いたのと同じく、仮説を構築するために使うべきもので、仮説を根拠づけるのに使ってはいけないんじゃないか。
と、そんなことをつらつらと考えていた。


登場した本

現場で使える統計学

  • 作者: 豊田 裕貴
  • 出版社/メーカー: 阪急コミュニケーションズ
  • 発売: 2006-09-28
  • ASIN: 4484062313
  • メディア: 単行本(ソフトカバー)
  • amazon.co.jp詳細へ

統計数字を疑う なぜ実感とズレるのか? (光文社新書)

  • 作者: 門倉 貴史
  • 出版社/メーカー: 光文社
  • 発売: 2006-10-17
  • ASIN: 433403375X
  • メディア: 新書
  • amazon.co.jp詳細へ

(話の流れで引用にちょうど良いと判断したのであって、類書の中で「特にこれがお奨め」というわけではないことに注意してくださいね。まぁ、読む価値が無いと判断したものから引用したりはしないですけど)

Google Readerのショートカット [tech][tips]

Hack Attack: Getting good with Google Reader

j, k は使っていた。v, u あたりはこれで知ったのでこれから使うだろう。
Firefoxの"Search for text when I start typing."と衝突して他のショートカットは事実上私には使えないんだよな。

クイズマジックアカデミーが [game]

IVになっていた……。

発勁…… [気になる本]

知ればナットク 発勁のしくみ

  • 作者: 青木 嘉教
  • 出版社/メーカー: 愛隆堂
  • 発売: 2007-02
  • ASIN: 4750202924
  • メディア: 単行本
  • amazon.co.jp詳細へ

*1 もちろん、どんなデータを集めるか? の意志決定と、実際にデータを集めるところまで含めて「統計」だけどこのエントリの中ではそこには言及しない。