MLへの新着メールのrssでの情報提供(その2)
MLへの新着メールのrssでの情報提供(その1)の続き。
【で、どうやる?】
大まかな処理の流れとしては、
- HTMLアーカイブ化メールの送信先をスクリプトにする。
これは、/etc/aliasesにスクリプトに食わせるアドレスを追記するか、
crontabの中で明示的にメール送信先を記述する。
- メールを受け取ったスクリプトは、新規追加URLだけを抜き出して
- そのURLからHTML化された記事をgetして
- getした記事から、rssに載せるべきフィールドを抜き出して
- rssを生成する。
- その際に、rss上の古い記事の情報を消す。
みたいな感じ。
【具体的には?】
- 上記1はすぐできる。
- 上記2はgrepでも、sedでも、awkでも、perlでも、何ででもすぐ出来そう。
- 上記3はperlのLWP::Simpleでさっくりできそうな気が。
- 上記4も、元のHTMLがMHonArcで生成された定型的なものなので、perlのTemplate::Extractでできそうな気が。
- 上記5もperlのXML::RSSの出番だな。
- 上記6もXML::RSSでできそうだけどよく知らないので(^^;、rssに載せる新着記事数をあらかじめ決めておいて、毎回生成すれば簡単そう。
つまり、ほとんどTemplate::Extract + XML::RSS でRSS 生成そのもの(^^;
がー、woodyにはTemplate::Extractが含まれているdebは無いのかな?
投稿者 his : 2004年10月15日 01:31
このエントリーのトラックバックURL: http://hoop.euqset.org/blog/mt-tb2006.cgi/712
MLへの新着メールのrssでの情報提供(その5)
概要 MLへの新着メールのrssでの情報提供(その4)につっこみが入った。 ヘッダがUTF-8なのに、エンコードはJISなので、文字化けが起きているのはわかっていたが、手元のsageだと、ヘッダにあわせてUTF-8で送ると逆に化けていた。 もう面倒なので(^^;、bodyにあわせてヘッダを...
ウェブログ: shibata(hi) shokudou
時刻: 2004年10月20日 04:01