2007-06-11 [長年日記]
■スケーラブル
最近意識しているキーワード「スケーラビリティ」。スケーラビリティについて学びたい人が絶対に読むべき「この一冊」という本は存在するだろうか。もし存在するなら、それは何だろう。
結城浩のはてな日記
実は未読なんですが。
1章 はじめに
2章 ウェブアプリケーションのアーキテクチャ
3章 開発環境
4章 国際化とローカライゼーションとUnicode
5章 データの一貫性とセキュリティ
6章 電子メール
7章 リモートサービス
8章 ボトルネック
9章 ウェブアプリケーションのスケーリング
10章 統計、監視、報告
11章 API
という章立て。
目次を見て、スケーリングが後ろの方にあるという章立てに、ははぁなるほど、と思いました。
リソースが不足してるからマシンを足そう、というのがスケーリングではないという意志の現れ。
サプライヤが例えばサーバの広告に付けるような「ハードウェアの冗長性」なんていう売り文句は、スケーリングではないということ。
3章、4章が"開発環境","国際化とローカライゼーションとUnicode"とあってアプリケーション開発の領域の話になっています(5章もそうですが)。
ハードウェアを増強すれば、それだけでスケーリングになるかと言えばそんなことはない。
ハードウェアを増強することがスケーリングにつながるようなアプリケーションの構造。
帯域やリソースが不足した時に"何がどのように不足なのか?"ということを明らかに出来る環境。
リソースを増強する必要が出た時に、"何をどの様に増強すればどのようになるのか?"があらかじめ検討されているという状態。
そういう状態に組織・環境・アプリケーションを保つということ。
それがスケーラビリティなのかと、目次を眺めてみた瞬間に自分の中の概念がひっくり返ったので、購入。
でも読んでないんです。orz
追記
結城さんの言っている「スケーラビリティ」はまた別の(というか広い)話なんでしょうね。
「ある量」が100倍になった時に全体はどう変化するのか? それが1万倍になったら? 100万倍になったら?
量的変化がどういう質的変化をおこすのか? という意味かと思ったのですが。
WebやITシステムでは、「ある量」はページビューや転送量やユーザ数やトランザクション数ということになりますか。
2007/6/13 トラックバックした
■徒然なるままに「ひっそり書いてるんだから」考
人数が少ないうちにはうまいバランスがあり得るが、サイトのアクセス数が多くなって(あるいはそのサービス全体のユーザ数が多くなって)くると、母数が増えてくるために「うざい人」の人数は多くなるだろう(割合が変わらなくても)。
www.textfile.org - 「匿名性」と「ほめてほしい人だけ見て」の同居は難しいかも
読んでいて、検索における再現率と適合率のトレードオフに似ているなぁ、とか思った。
再現率は「検索クエリに適合するもののうち、実際に検索されたものの割合。適合率は、「実際に検索されたもののうち、検索クエリに適合するものの割合」。
「検索クエリに適合するもの」がアバウトで、検索システムの評価の難しいところ。
「○○は××だ」で検索した時に、「○○は××だというのは真っ赤な嘘」という趣旨の文書が引っかかった時にこれを「適合する」と言えるだろうか?
そんなの引っかかって当たり前だろ、と思う人はコンピュータシステム寄りの、論理的な思考の人なんだろうと思う。
「プリズナーNo.6 ネタバレ」で検索して「プリズナーNo.6 のネタバレなんて書こうとしても書けるものじゃない」っていうのが引っかかってきたり、実際プリズナーNo.6 のネタバレを書いたページなんて上位に出てこない。
それで「Google 使えねぇ」とか「検索語が悪かったか」と思う人こそあれ、「そうか無いのか」と素直に思う人はそうはいない様な気がする。
ところで、再現率と適合率はある検索クエリに対して出てくる数字で、検索クエリ全体に対してでてくるわけじゃない。だいたい検索クエリ「全体」って一体?何 という話だ。
だから、検索システムの評価は複数の検索クエリに対する平均の値を見ることになるのが現実。
これを先のモデルに当てはめようとするとどうなるだろう?
例えばある誰かと自分の感性が似ている――つまりは話が合うと感じることがある。
そうはいっても一から十までそっくり同じとはいかない*1。ある領域では自分は興味があるけど相手は全然興味がない、あるいはその反対ということもある。
さらにはある領域では真っ向意見が対立することもあるだろう。
「少数でもいい」から「とにかく自分に近い人」の集団を欲求するのは、検索で言えば「再現率は低くても良いから適合率を高く」ということか。
じゃあ逆は、「ある面でのみ自分に近い人」でいいから「多数の人」の集団を欲求するのは、「適合率は低くてもいいから再現率を高く」ということになるなぁ。
この場合「検索クエリ」は「自分はこう思ってますよ」という表明にあたるのか。
後者に属する人は blog とトラックバックと RSS で構成される粗い網を好んで使う。批判されたり否定されることも厭わない。
適合率が低いことを承知でシステムを使う。
同じblogであれやこれや、いろんな話題を書くとも予想される。
自分と「部分が似ている人」を的にしているから。
前者は招待とアクセス制限を好む。あるいは、メーリングリストで満足するかも。
適合率が低いことは我慢できない。
自分の中のごく一面だけを表にすると予想できる。
「私は○○が好き!」という話題だけを書いていれば、同じ様な人の集まりが形成される(はずだと思いこむ)。
「私は○○と□□と△△が好き」と書くのは、「○○と□□と△△が好きな人」が集まって欲しいからだろう。
「○○と□□は好きだが△△が大嫌いな人」は(検索のメタファでいう)ノイズになる。
あ、そっか。
Mixi なら、○○と□□と△△が別なコミュニティとして存在しているので、「○○が好きな人」「□□が好きな人」「△△が好きな人」と個別に話ができるんだ。
「○○と□□は好きだが△△が大嫌いな人」とは、○○のコミュニティと□□のコミュニティとで出会うかもしれないけど、そこでは△△の話題はまぁでないだろう。
Mixi の中では「○○と□□と△△が好きな人」とだけ相手をしているという錯覚を得ることができるんじゃないだろうか。
その錯覚を抱いたまま公開された blog の世界に来たときに、錯覚の方を信じたい人がネガティブな意見に非常に強い反応をしてしまうと。
(検索システムへのメタファはどうなった?)
(いや、書いている途中でどうでもよくなったのかも……)
■コン・ゲーム
オーシャンズ11、12、13シリーズや60セカンズ のように、泥棒や犯罪(殺人は除く)を鮮やかにやってのけるアメリカ映画を探しています。
http://q.hatena.ne.jp/1181477252
「鮮やかにやってのける」のあたりが微妙だけど、
に一票。
「微妙」と書いたのは、"鮮やかにやってのけ"たのが果たして作中の人物なのか、映画の監督・脚本なのかというあたり。
してやったり、コンゲーム小説、映画は? (1/2) - その他(エンターテインメント) - 教えて!goo
コン・ゲームの面白い映画を教えてください - その他(映画) - 教えて!goo
Fliers 映画用語辞典
あたりかね……。
■偽装請負
未読(斜め読み状態)だけど、読み終わったときに何も書かないだろうと予測できるので、今書いておく。
p16-17
偽装請負と呼ばれる雇用システムをひとことで言い表すなら、「必要がなくなれば、いつでも使い捨てることができる労働力」のことだ。企業にとって、これほど都合のよい「雇い方」はない。
(略)
偽装請負の実態は、労働者派遣そのものだ。しかし、請負契約を装っているので、労働者派遣法の制約は全て無視する。派遣労働者の場合、一定の年限が来れば、直接雇用の申し込み義務が発生するが、請負と偽っているので、申し込まない。つまり、同じ顔ぶれの労働者を何年も都合よく使うことになる。
Amazonのランキングもそこそこ。
本屋に行けば平積みもされている。
でも、今ひとつ話題になっていないような気が。
1章、2章でキヤノン、松下の事例。
3章で「日本最大の請負会社グループだった(p35)」クリスタルの経路。
4章で現場での危険性――自己が起きたときに企業がじこそのものを隠したりする傾向がある――ことを書いている。
5章は政府や企業の責任を考える、とある(この章は本当に未読)。
サブタイトルにも付いている通り「格差社会」というキィワードがしばしば出てくるが、この本が真に価値があると主張したいのなら、時事的なキィワードを入れるべきではなかったと思う。
*1 そっくり同じなら同じで、同族嫌悪に陥るような気がする。まぁこれは余談。