2007/12/16 日曜日

WordPressを再度使ってみます

Filed under: ブログ — webmaster @ 23:32:25
この記事のタグ:, , ,

 WordPressを夏頃まで使っていたのですが、その後はもともと使っていたMovableTypeの方に戻って、ブログの更新を続けていました。しかし、MovableTypeの方は投稿した記事の数が既に3000を超えていて、投稿をするたびに途中でタイムアウトが発生するようになってしまいました。さすがに静的なページを公開し続けているのですが、再構築や投稿時の負荷は極限まで高くなってしまったようです。このままでは新しい記事の公開に影響が出てきてしまっているため、そろそろ別の手段でブログを公開することを考えなければいけません

対処法としては、 こちらのWordPressで公開しているサイトを使って今後の更新を続けていくことと、もう一つの案はMovableTypeで新しいブログを作って、新しい記事についてはそちらに投稿していくことが考えられます。

もう少し、対処方法については熟慮したいと思っていますが、MobavleTypeも記事が肥大化したときの運用性を考慮すると、こちらのWordPressのブログを使って、新しい記事を公開していった方が現実的なのかなという気持ちが徐々に大きくなっています。

今まで、ここのバージョンはme2.2.1を使用してきたのですが、今日になってバージョンを確認してみるとme2.2.3が公開されていました。今年の9月に公開されていたようですが、全く今まで気がつきませんでした。この記事を投稿するのにあたり、me2.2.3へアップデートをしておきました。アップデートの方法は非常に簡単で、2.2.1から2.2.3へアップデートするためのファイルをダウンロードして解凍後にftpソフトを使って上書き転送しただけです。特にアップデートスクリプトなどを走らせる必要もなく、今回はアップデートが完了しました。非常に快適です。

半年近く、こちらのブログについてはメンテナンスをしてこなかったので、プラグインなどについてもバージョンチェックをして古いものについては入れ替えをしていこうと思っています。



関連する記事:
  • None

2007/7/25 水曜日

攻撃? クローラー?

Filed under: ブログ — admin @ 10:03:58
この記事のタグ:, ,

■最近ページロード要求件数が増えている 

 この前の土曜日あたりから急に、このWordPressで作成したブログに対するPageLoads件数が増えてきてしまいました。それまでは一日あたりは多くても200から300程度のPageLoadsしかなかったのですが、日曜日は13時現在で1671件ものページロードが発生しています。サーバーにもかなりの負荷をかけてしまっているようで、503エラーがときどき出てきます。原因を追究して是正しないとまずい雰囲気です。

■考えられる原因

 想像すると、急にアクセス件数が増えるとしたら、検索サイトのクローラーが全ページを読み込んでキャッシュをしているか、攻撃を受けているかどちらかでしょうか。どこかの有名サイトから突然リンクされて、アクセス件数が増えているということも有り得ますが、このサイトはまだ立ち上げたばかりなのでそうは簡単に有名サイトからのリンクをもらえるとは思いにくい側面もあります。(もう一つ、以前から運用しているブログサイトでは、数週間前にYahoo!ニュースから直接のリンクを張ってもらったことがあり、このときのアクセス件数はものすごいことになりました)

■アクセス解析ソフト

 まずはアクセス解析ソフトの方でどのページへのアクセスが増えているのか確認してみました。ダントツでトップページに対するアクセス要求が多いです。しかし、トップページに貼り付けているアクセスカウンターは45しかカウントしていません。このアクセスカウンターは他のサイトが提供しているブログパーツで、Javaスクリプトになっているので、たくさんアクセスをしてきているところはJavaスクリプトを解釈することができないもののようです。

 次にクローラーがページを読み込んだ量をアクセス解析ソフトで確認しました。「612266.crawl.yahoo.net 」という感じの名前のクローラーが合計で142回アクセスしていますが、1671件にはほど遠い数字であり、クローラーが原因というわけでもないようです。

 ということは、普通のブラウザを使った利用者からのアクセスという可能性が低く、かつ検索エンジンのクローラーからのアクセスでもないとすれば、このサイトにとってはあまり有難くないアクセスということになってしまいます。

■何が原因か判らない

 他にもアクセス解析ソフトのほうでユーザエージェント値やリンク元サイト、ユーザID、リンク元サーバーなどの統計情報をつぶさに見ていったのですが、このページロードの要求を出していると思われる原因が判りませんでした。このアクセス解析に関しては、SSIとJAVAスクリプトを組み合わせて動作しているものなのですが、今回、アクセス件数が増えている原因のものは、SSIやJAVAスクリプトに影響を与えないようなアクセスの仕方をしているのかもしれません。

 グーグルのアクセス解析も導入しているので、こちらもあわせて確認したのですが、傾向は同じで原因を知ることはできませんでした。

 直接、Apacheのアクセスログを解析しないと判らないのではないかという気がして来ました。

■対策

 原因が判らないと打つ手がなくなってしまいます。今しばらく、アクセス状況を監視して、もしも減少する傾向にならなければ、問題点を特定するための何らかの対策を考えていきたいと思います。次に取る対策としては、さくらインターネットではApacheのアクセスログを利用者に公開してくれているので、これを自分のパソコンにFTPソフトでダウンロードして、そのログの中を解析するという方法が最も有力なのではないかと思っています。



関連する記事:
  • None

HTML convert time: 0.694 sec. Powered by WordPress ME