過去の日記

2007-01-28 [長年日記]

意味は似ていても使える局面が違う [hatena]

標準偏差を平均で割ると変動係数とよびますが、分散を平均で割る LEXIS RATIOの和訳は、何というのでしょうか。 意味は、変動係数と同じでしょうか。
http://q.hatena.ne.jp/1169852099

標準偏差は(形式上)元々の単位で捉えられるので、平均で割ると単位無しの"比率"になる。
かたや分散は(形式上)元々の単位の二乗になっている。なので平均で割ったものは単純な比率ではなく元データの単位に依存する数値になる。


これが意味するところはというと。
なにかの店の1日の売り上げ金額と来客者数のデータが、ある期間分あるとしよう。
売り上げの変動係数と、来客者数の変動係数を比較することはできる。比率であって単位がない数値だから(比較することに意味を見いだせるかはまた別の話)。
売り上げの LEXIS RATIO と、来客者数の LEXIS RATIO を比較することはできない。計算式を考えると形式上、売り上げの LEXIS RATIO は(日本なら)円の単位だし、来客者数の LEXIS RATIO は人の単位だ。だから、普通に考えて売り上げの LEXIS RATIO の方が大きいに決まっている(円単位なら、だ。100万円単位、1000万円単位にすると事情は変わってくる)。


5,000円, 2人
6,000円, 3人

平均 5,500円, 2.5人
分散 250,000, 0.25
標準偏差 500(円), 0.5(人)


変動係数は 0.091, 0.2 となる。これを「売り上げ金額よりも人数の方が(平均値に比較して)2倍強変動している」と読むとして、まぁ感覚とあっていると思う。
LEXIS RATIO は 45.5, 0.1 となる。(変動係数も LEXIS RATIO もてきとーなところで四捨五入している)
ここで、売り上げを千円単位にしても変動係数が変化しないことと、LEXIS RATIO が変化してしまうことを自分で計算して確認するべき。


LEXIS RATIO は同じデータを違う母集団で*1(あるいは同じ母集団で別の期間に)収集した時にだけ比較可能。


……あってる?

逆宝くじとリスク [etc]

あー、そういう考え方もあるのかぁ。
でもなぁ……、と思ったその「でもなぁ」の続きが認識できたので書く。

非常に小さなリスクでも無視していいとは限らないという話は以前に書きましたが、その他に、そのリスクによって得られるメリットは何かを考える必要があります。

Log of ROYGB - 逆宝くじ

「逆宝くじを買うか買わないか」と「新型クロイツェルヤコブ病に罹患するリスクを考えて牛肉を食べるか食べないか」の選択の間にある、大きな違い。
というか、逆宝くじを買って大きな負債を負った*2時と、新型クロイツェルヤコブ病に罹患した時の大きな違い。
「自分が決断しなかった側」の結果が後から観測できるかできないか。
逆宝くじを買っていなければ負債を負うことはなかったと言える。
でも牛肉を食べることを止めていれば、新型クロイツェルヤコブ病に罹患しなかったと言えるだろうか? 言えないだろう。
現実に起こる事のほとんどは、後者の様に「観測可能な事象」は非対称性を持っており、それこそが日々の選択が難しい理由だ。


注意
「逆宝くじ」は一つの「単純化した喩え」であろう。この喩えを否定することが、上のエントリで id:ROYGB さんが書きたかったことを即否定するのではないことは要注意。


追記 2007/1/29
選択しなかった側が観測不可能である点は、ちょうど今読んでいる、

ひとりっ子 (ハヤカワ文庫SF)

  • 作者: グレッグ イーガン
  • 出版社/メーカー: 早川書房
  • 発売: 2006-12-01
  • ASIN: 415011594X
  • メディア: 文庫
  • amazon.co.jp詳細へ

の1本目の短編のテーマ(の一部)なのかも。

*1 厳密な意味で使ってない。

*2 同義反復?