amebloのシステムについて考える。 | ふぁんくしょん

amebloのシステムについて考える。

このblogシステムいろいろ不具合があるみたいなので、いろいろ気になって空想してみました。amebloの発表によるとランキングシステムが過負荷で1月は中止だとのことですが、ランキングは算出方法が分からないと負荷について語れないのでその他の面について書きます。

以下、勝手な妄想ですが書いてみます。
もしあっているなら雇ってください(笑)。


各記事のページが.htmlになっているけど動的に生成しているよね?
tDiaryというBlogシステムには同様の仕組みがあるのでそれをまねていると思います。下で触れますが、お気に入りの更新順が個別記事の.htmlページでも正確なので動的生成にしないと上手くいかないですよね?
.htmlとなっているファイルの方が検索エンジンに高く評価されるという迷信(?)があるのでそれに従っているのだと思います。


お気に入りに入れたページを更新順に並べて表示する仕組みは、上手く作らないと非常にコストがかかる
他の日記サイトではこの機能を導入してすぐにサーバーダウンが頻発したことがあります。もし、ページを動的に生成しているならその生成のたびに並び替えにnlognかかります。ランク上位のブログの人はこれでもかというほどお気に入りに登録していて(しかも、それなりにアクセスがある)ので結構大変です。もし静的だったとしても、誰かが記事を投げた瞬間その人をお気に入りに入れている人のすべての記事の該当部分を書き換える必要がありそうです。動的+キャッシュ等の技を駆使していないと難しいかも。


検索エンジンのロボット対策をすると良いかも
googleのやつとかはたいしたこと無いのですが、ある検索エンジンのロボットはほぼ同じ瞬間にあるサイトのすべてのページをに対してアクセスをかけます。これはページを取得してリンクを見てすぐにそこに飛んでいく(もしくは巡回先のリストをサイトのアドレス順に持っているため同一サイトのページは同じタイミングでリクエストされる)ためです。blogのようなサイトはページ数が他の種類のサイトと比べて異常な数になります。行儀の悪いロボットが何十万(?)というページへのリクエストをほぼ同時に出すのですからたまったものではありません。
そんなロボットからのリクエストには適当なページを返すようにするのはどうでしょうか?(もうやってるかな)

以上、第二回があるかどうか分からないですが、第一回でした。