2006/05/28(日) [n年前の日記]
#1 [hns] おそらくは海外からのSPAMコメントも来ちゃったみたいなので hns のツッコミ(コメント)機能にちょこっと修正を加えた
コメント投稿の際に、メールアドレスを入力してあったら弾くようにしてみたり。
今時は、掲示板等にメルアドを書いてるとSPAMメールがガンガン届くようになっちゃう。ので。昨今はメルアドを入力しない人が主流だろうとも想像する。逆に言うと、メルアドを書いてくるのは大体SPAMコメントだったりするはず。
board.cgi の action_post サブルーチン中に以下の一行を追加。
board.cgi の場合、本文は $body に入ってるのかな。なら、特定単語が入ってたら弾く、ということもできそう。
今時は、掲示板等にメルアドを書いてるとSPAMメールがガンガン届くようになっちゃう。ので。昨今はメルアドを入力しない人が主流だろうとも想像する。逆に言うと、メルアドを書いてくるのは大体SPAMコメントだったりするはず。
board.cgi の action_post サブルーチン中に以下の一行を追加。
die 'メールアドレスが入っています。' if $email ne "";ただ、日本語でSPAMコメントを投稿してくる業者は、メルアド欄に何も入力しないので効果が無い。
board.cgi の場合、本文は $body に入ってるのかな。なら、特定単語が入ってたら弾く、ということもできそう。
◎ もう一つの掲示板のほうが凄いことになってた。 :
_自宅サーバが落ちたときなどの連絡/報告用に一応置いてあったり
するのだけど。覗いたら、外人のSPAMコメントで覆いつくされてた。本来の記事が過去ログに落とされちゃうぐらいに凄い状態に。
マズイ。手を打たないといかんとはずっと思ってたけど、時間が無くて禁止IPを並べておくぐらいしかできなかったわけで。
書き込み元のIPを眺めたら、おそらくは世間に存在するproxyサーバを手当たり次第に使って書き込んでるとかそんな感じ。列挙していくだけでproxyサーバリストが作れてしまうかもしれん。たぶん。…何にせよ、IPで対応するのは限界がある。
ということで、そちらの掲示板もメルアドを入力すると弾くように修正。
が。それだけでは弱そうな気もする。ということで、本文が半角英数文字のみで記述されてる場合も弾くように。
ただし、jcode.pl の getcode() 「のみ」を使って、asciiだけなのか、日本語があるのかを判断してるというモノグサ対応なのがちとアレかも。与えられた文字列が sjis か euc か判別できない場合も undef を返すので、日本語を打ち込んでいるにも関わらず「半角英数のみの〜」と言われる可能性がある。が、どうも半角カナを利用したときに判別できなくなることが多い、との話もあるので、ごくフツーに日本語で打ち込んでる分には誤判定しない…てな感じだったらいいなぁ、と淡い期待。…掲示板がSPAMで埋め尽くされてる状況に比べたら、ちょっとやそっとの誤判定は、まあ、いいよね。
まあ、そもそもあんまり使ってないからアレなんだけど。>緊急用の掲示板。
マズイ。手を打たないといかんとはずっと思ってたけど、時間が無くて禁止IPを並べておくぐらいしかできなかったわけで。
書き込み元のIPを眺めたら、おそらくは世間に存在するproxyサーバを手当たり次第に使って書き込んでるとかそんな感じ。列挙していくだけでproxyサーバリストが作れてしまうかもしれん。たぶん。…何にせよ、IPで対応するのは限界がある。
ということで、そちらの掲示板もメルアドを入力すると弾くように修正。
が。それだけでは弱そうな気もする。ということで、本文が半角英数文字のみで記述されてる場合も弾くように。
my $comment_tmp = $in{'comment'}; my $code = &jcode::getcode(\$comment_tmp); &error("半角英数のみの投稿は広告書き込みと判断しています。") if $code eq undef;こんな感じ。
ただし、jcode.pl の getcode() 「のみ」を使って、asciiだけなのか、日本語があるのかを判断してるというモノグサ対応なのがちとアレかも。与えられた文字列が sjis か euc か判別できない場合も undef を返すので、日本語を打ち込んでいるにも関わらず「半角英数のみの〜」と言われる可能性がある。が、どうも半角カナを利用したときに判別できなくなることが多い、との話もあるので、ごくフツーに日本語で打ち込んでる分には誤判定しない…てな感じだったらいいなぁ、と淡い期待。…掲示板がSPAMで埋め尽くされてる状況に比べたら、ちょっとやそっとの誤判定は、まあ、いいよね。
まあ、そもそもあんまり使ってないからアレなんだけど。>緊急用の掲示板。
◎ そういやg氏が管理してる掲示板も凄いことになってたっけ。 :
あちらさんは、本物のお客さんが、メルアドを打ち込むこともありえるし、半角英数のみの投稿もありえるだろうし、http:// という文字列が大量にあるだけの投稿もありえるだろうしで。対応するとしたらどういう手があるんだろう。ちと悩むよなぁ…。
広告目的の書き込みである以上、URLは必ず残すから、それで判別とか。と言っても、それらURLですら自動生成だろうしなぁ。
広告目的の書き込みである以上、URLは必ず残すから、それで判別とか。と言っても、それらURLですら自動生成だろうしなぁ。
[ ツッコむ ]
以上です。