2020/01/08(水) [n年前の日記]
#2 [hns] hns_linkarc.pl が https に対応してないことに気づいた
この日記ページは、hns というWeb日記システムを使って表示されていて。更に、各記事内でメモしたリンク先が消滅した際のバックアップを兼ねて、hns_linkarc.pl というPerlスクリプトを回して、リンク先をサーバに保存しているのだけど。
*1
その、hns_linkarc.pl が、https に対応してなかったことに、今頃気づいてしまった…。結構膨大な数のページがバックアップできてなかった…。いやまあ、hns が使われていた当時、ネット上のURLは http ばかりで、https なんてほとんど無かったから…これはもう仕方ない。
一応修正を試みたり。hns_scan() 内で、「http:」の文字列があるかどうかを調べているので、「https:」についても調べるようにすればいいのではないかな。たぶん。
ただ、このスクリプトは、LWP なるPerlモジュールを使ってURL先を取得しているようで。その LWP が https も取得できるかどうかが、ちょっと気になる。
その、hns_linkarc.pl が、https に対応してなかったことに、今頃気づいてしまった…。結構膨大な数のページがバックアップできてなかった…。いやまあ、hns が使われていた当時、ネット上のURLは http ばかりで、https なんてほとんど無かったから…これはもう仕方ない。
一応修正を試みたり。hns_scan() 内で、「http:」の文字列があるかどうかを調べているので、「https:」についても調べるようにすればいいのではないかな。たぶん。
sub hns_scan($) { ... if ($_ =~ /^(LINK|LSUB|LNEW|LSTRIKE|LIMG)\s+((http:|ftp:)\S+)/) { ↓ if ($_ =~ /^(LINK|LSUB|LNEW|LSTRIKE|LIMG)\s+((https:|http:|ftp:)\S+)/) {
ただ、このスクリプトは、LWP なるPerlモジュールを使ってURL先を取得しているようで。その LWP が https も取得できるかどうかが、ちょっと気になる。
◎ LWP を https に対応させる。 :
ググってみたら、LWP を https に対応させる方法が紹介されてた。まあ、エラーが出る場合はこうしよう、てな話だそうで、エラーが出ていない環境なら、やらなくてもいい作業かもしれないのだけど。
_[Perl,CPAN]LWPでhttpsにアクセスする方法 - Qiita
一応、念のため、自分も上記ページを参考にして作業。
root になってから、以下を打った。
色々ビルドしたようで、結構時間がかかった。
前述の hns_linkarc.pl を実行してみたけれど、https: が書かれたURLも取得できているように見える。これでなんとかなったかな。たぶん。
_[Perl,CPAN]LWPでhttpsにアクセスする方法 - Qiita
一応、念のため、自分も上記ページを参考にして作業。
root になってから、以下を打った。
perl -MCPAN -e shell install Crypt::SSLeay install IO::Socket::SSL install LWP::Protocol::https exit apt install perl-Net_SSLeay apt install perl-Crypt-SSLeay apt install perl-IO-Socket-SSL
色々ビルドしたようで、結構時間がかかった。
前述の hns_linkarc.pl を実行してみたけれど、https: が書かれたURLも取得できているように見える。これでなんとかなったかな。たぶん。
*1: 保存しているのはリンク先の html のみで、画像やCSS等は保存していなかった…ような記憶が。まあ、テキスト情報だけでも残っていればまだマシというか。また、バックアップしたソレを見るためには、特定のユーザ名とパスワードが必要になるので、誰でも見れる状態にはなってない、と言い張れるのではないかなあ、と…。
[ ツッコむ ]
以上です。