libhuginn
履歴閲覧: 最新 2022/04/19 2021/10/05 2021/10/05 2018/07/05 2018/04/14 2016/02/05 2013/11/21 2013/11/20 2012/08/15 2006/05/16 2005/02/10 2003/10/24 2003/09/12 2003/09/11 2003/09/10 {2003/05/08[差分表示]}
ynakataさんお手製のヘタレなアンテナ、用のPerlライブラリ。
ちなみに公開場所はこのへん。
関連ページ
- dot.huginnrc 書き方とか。
- 正式公開ページ 現在お引っ越し作業中
できること
- hina.di/LIRS/hina.txtから情報を取り込める。
- 取りこめるのはいいが派手に情報が欠落する。
- おまけに適当なフォーマットで人様に情報提供なんてできやしない(コード書きかけで放置中)
とあれこれ難点満載ですが、近ごろ本人メタ情報流通系とか見ればわかるように妙なやる気を出しているので、ひょっとすると化けるかもしれません。化けないほうに100カノッサ。
化けてくれること期待age.で化ける方に100カノッサ.…理由は単に「なんかよくわかんないけど面白そうだから」<無責任--2002/03/15 21:31 Wayne
MISXなYaPwで、概念構築はだらだらと進めてます。そろそろプロトタイプ実装すべき時期って気もするけど。--2002/03/18 12:20 ynakata
最新版はこのサーバのCVSレポジトリに入ってます。
がレポジトリ自体が公開されてない上に、ほぼ完全にynakataさんの個人用レポジトリと化しております。
意見とか要望とか。
データ取得方法についての覚え書き
-
(1) REMOTEによるデータインポート
- 極力独自取得はしない:REMOTE優先
- REMOTE間では「メタ情報生成時刻が新しい方」を優先する目論見でコードを書きかけてロジック崩壊中の模様(--;
- (2) HEADによるLast-Modifiedフィールドの取得
- (3) GETによるLast-Modifiedフィールド・文字列の取得
-
(4) GETで取得した本文サイズのある程度以上(設定項目)の変更
-
この場合、「最終未更新確認時刻(LNMD)」を更新時刻として設定
- LNMDは、通常前回の巡回時刻になるはず。
-
この場合、「最終未更新確認時刻(LNMD)」を更新時刻として設定
データ保持形式についての覚え書きなぞ書いてみた。
文書更新検知方式について
よくよく考えると俺様libgajafなんてものを抱えていて、あれの出力するハッシュ値は「文書に含まれている単語が似ていれば似てくる」という文書更新検知系にとってはなかなか優秀な性質を持っていたりするのですじゃよ。(実質長さで十分だとも思っているのだけど、一考の余地はありそう。)--2002/08/15 10:23 ynakata