mieki256's diary



2004/08/23(月) [n年前の日記]

#1 [hns] ocnの方がこのページを見れてないという報告が

報告ありがたや。感謝であります。

spam用メルアド収集ロボットを弾くために、conf/access_control.txt で、marunouchi.tokyo.ocn.ne.jp を一括denyしてますた(爆) 見れなかった方、スマソ。denyしてた行を削除しておいたので、これで見れるんじゃないかと。

そのままだと件のロボットも受け付けてしまうので :

_o氏の記事 を参考にして別の設定を。lib/HNS/Status.pm に、cookieを強制するようパッチをあてて。.htaccess で、「referer がない」「特定の remote_host、UA」でアクセスしてきた場合、とあるページに飛ばすように。

あっ :

googleのクローラーはcookie食うのかしら。googleにはページを漁ってもらいたいのだけど。

アレ? :

lynx や Mozilla Firefox で cookie 拒否して動作確認したのに、ページが表示されてる。アレ?

改行コードが原因だった :

Status.pm やら browser_list.txt やら、その他モロモロのファイルを、CR+LF のまま転送してた。LFにして転送したら「Cookieを再設定〜」のメッセージが見れた。 *1

動作したのはいいのだけど。結局、googleはどうなるのか。

Status.pmの動作をちょっとだけ追ってみた :

最初のあたりで、$self->is_robot(1) と書いてある。conf/browser_list.txt に記述された単語がUA内に見えた場合は、0になる。それ以外は、1のままなんだろう。1のままなら、パッチを当てた部分を経由しない。

ということは、ロボットであることを明らかにしてるアクセスなら、cookieを食えとは言われない、ということかしら。なら、このままでも google はページを見れるのだろう。逆に、UA詐称ロボットは、cookieを食えと言われる上に、食わないとページが見れないと。

*1: モノグサなので、xyzzy + ftpupdae を使ってるのだけど。ftpupdate は改行コードについては何も変更しないでアップロードするので、ローカルでも改行コードをLFにしておく必要が。忘れてた。

以上です。

過去ログ表示

Prev - 2004/08 - Next
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

カテゴリで表示

検索機能は Namazu for hns で提供されています。(詳細指定/ヘルプ


注意: 現在使用の日記自動生成システムは Version 2.19.6 です。
公開されている日記自動生成システムは Version 2.19.5 です。

Powered by hns-2.19.6, HyperNikkiSystem Project