2004/08/23(月) [n年前の日記]
#1 [hns] ocnの方がこのページを見れてないという報告が
報告ありがたや。感謝であります。
spam用メルアド収集ロボットを弾くために、conf/access_control.txt で、marunouchi.tokyo.ocn.ne.jp を一括denyしてますた(爆) 見れなかった方、スマソ。denyしてた行を削除しておいたので、これで見れるんじゃないかと。
spam用メルアド収集ロボットを弾くために、conf/access_control.txt で、marunouchi.tokyo.ocn.ne.jp を一括denyしてますた(爆) 見れなかった方、スマソ。denyしてた行を削除しておいたので、これで見れるんじゃないかと。
◎ そのままだと件のロボットも受け付けてしまうので :
_o氏の記事
を参考にして別の設定を。lib/HNS/Status.pm に、cookieを強制するようパッチをあてて。.htaccess で、「referer がない」「特定の remote_host、UA」でアクセスしてきた場合、とあるページに飛ばすように。
◎ あっ :
googleのクローラーはcookie食うのかしら。googleにはページを漁ってもらいたいのだけど。
◎ アレ? :
lynx や Mozilla Firefox で cookie 拒否して動作確認したのに、ページが表示されてる。アレ?
◎ 改行コードが原因だった :
Status.pm やら browser_list.txt やら、その他モロモロのファイルを、CR+LF のまま転送してた。LFにして転送したら「Cookieを再設定〜」のメッセージが見れた。
*1
動作したのはいいのだけど。結局、googleはどうなるのか。
動作したのはいいのだけど。結局、googleはどうなるのか。
◎ Status.pmの動作をちょっとだけ追ってみた :
最初のあたりで、$self->is_robot(1) と書いてある。conf/browser_list.txt に記述された単語がUA内に見えた場合は、0になる。それ以外は、1のままなんだろう。1のままなら、パッチを当てた部分を経由しない。
ということは、ロボットであることを明らかにしてるアクセスなら、cookieを食えとは言われない、ということかしら。なら、このままでも google はページを見れるのだろう。逆に、UA詐称ロボットは、cookieを食えと言われる上に、食わないとページが見れないと。
ということは、ロボットであることを明らかにしてるアクセスなら、cookieを食えとは言われない、ということかしら。なら、このままでも google はページを見れるのだろう。逆に、UA詐称ロボットは、cookieを食えと言われる上に、食わないとページが見れないと。
*1: モノグサなので、xyzzy + ftpupdae を使ってるのだけど。ftpupdate は改行コードについては何も変更しないでアップロードするので、ローカルでも改行コードをLFにしておく必要が。忘れてた。
[ ツッコむ ]
以上です。