2004年10月15日

MLへの新着メールのrssでの情報提供(その2)

MLへの新着メールのrssでの情報提供(その1)の続き。

【で、どうやる?】
大まかな処理の流れとしては、

  1. HTMLアーカイブ化メールの送信先をスクリプトにする。
    これは、/etc/aliasesにスクリプトに食わせるアドレスを追記するか、
    crontabの中で明示的にメール送信先を記述する。
  2. メールを受け取ったスクリプトは、新規追加URLだけを抜き出して
  3. そのURLからHTML化された記事をgetして
  4. getした記事から、rssに載せるべきフィールドを抜き出して
  5. rssを生成する。
  6. その際に、rss上の古い記事の情報を消す。
みたいな感じ。

【具体的には?】

  • 上記1はすぐできる。
  • 上記2はgrepでも、sedでも、awkでも、perlでも、何ででもすぐ出来そう。
  • 上記3はperlのLWP::Simpleでさっくりできそうな気が。
  • 上記4も、元のHTMLがMHonArcで生成された定型的なものなので、perlのTemplate::Extractでできそうな気が。
  • 上記5もperlのXML::RSSの出番だな。
  • 上記6もXML::RSSでできそうだけどよく知らないので(^^;、rssに載せる新着記事数をあらかじめ決めておいて、毎回生成すれば簡単そう。

つまり、ほとんどTemplate::Extract + XML::RSS でRSS 生成そのもの(^^;

がー、woodyにはTemplate::Extractが含まれているdebは無いのかな?

投稿者 his : 2004年10月15日 01:31
このエントリーのトラックバックURL: http://hoop.euqset.org/blog/mt-tb2006.cgi/712
MLへの新着メールのrssでの情報提供(その5)
概要 MLへの新着メールのrssでの情報提供(その4)につっこみが入った。 ヘッダがUTF-8なのに、エンコードはJISなので、文字化けが起きているのはわかっていたが、手元のsageだと、ヘッダにあわせてUTF-8で送ると逆に化けていた。 もう面倒なので(^^;、bodyにあわせてヘッダを...
ウェブログ: shibata(hi) shokudou
時刻: 2004年10月20日 04:01
コメント
コメントする









名前、アドレスを登録しますか?





画像の中に見える文字を入力してください。