libhuginn
履歴閲覧: 最新 2022/04/19 2021/10/05 2021/10/05 2018/07/05 2018/04/14 2016/02/05 2013/11/21 2013/11/20 2012/08/15 {2006/05/16[差分表示]} 2005/02/10 2003/10/24 2003/09/12 2003/09/11 2003/09/10 2003/05/08
ynakataさんお手製のヘタレなアンテナ、用のPerlライブラリ。 ここは技術・構想の話がメイン。ふつーの話はhuginnの方へ。 <h2>関連ページ</h2> * dot.huginnrc 書き方とか。 * [正式公開ページ,huginn] <h2>できること</h2> * hina.di/LIRS/hina.txtから情報を取り込める。 * RSS/Atomから超いいかげんに情報を取り込める場合がある。 * 取りこめるのはいいが派手に情報が欠落する。 * おまけに適当なフォーマットで人様に情報提供なんてできやしない(コード書きかけで放置中) とあれこれ難点満載ですが、近ごろ本人メタ情報流通系とか見ればわかるように妙なやる気を出しているので、ひょっとすると化けるかもしれません。化けないほうに100カノッサ。 <span style="color: green">化けてくれること期待age.で化ける方に100カノッサ.…理由は単に「なんかよくわかんないけど面白そうだから」<無責任<span class='signature'>--2002/03/15 21:31 Wayne</span></span> <span style="color: blue">[MISXなYaPwで、概念構築はだらだらと進めてます。そろそろプロトタイプ実装すべき時期って気もするけど。<span class='signature'>--2002/03/18 12:20 ynakata</span></span> 最新版はこのサーバのCVSレポジトリに入ってます。 がレポジトリ自体が公開されてない上に、ほぼ完全にynakataさんの個人用レポジトリと化しております。 <hr /> 意見とか要望とか。 [@@bbs:[size=20/ynakata][%date%][]] +ynakata(2022/07/17 06:55)ZWTFrKHfwmqtYnbhs +ynakata(2022/07/17 05:53)CtAwgrNTZuXpVzC +ynakata(2022/04/19 14:19)uInjytIWaajtsONGIS +ynakata(2021/10/05 06:25)jVMXJaKAydoeLomX +ynakata(2021/10/05 00:43)KYuyXYOHdx +ynakata(2018/07/05 11:59)rQATbgsuDePkoM +ynakata(2018/04/14 00:37)lMxToEjHex +ynakata(2016/02/05 16:44)PwIgigVZ +ynakata(2013/11/21 16:43)eWOhsCiCqr +ynakata(2013/11/21 15:39)mXGJonSmmIhHpWKEV +ynakata(2013/11/20 20:38)FjzEVFvsW +ynakata(2012/08/15 19:36)tSrnsxpjQYfaIN +ynakata(2012/08/15 19:36)xLtufTGTEa +ynakata(2012/08/15 19:36)matFqVmGIPmiRP +ynakata(2012/08/15 19:36)LVoKsipZYOgL ynakata(2003/10/24 13:52)RSSからad hocにでもいいから情報取り出しをしたい、かも。 kto(2003/09/10 22:25)URL に "?" が入っているときは "?MMDDHHMM" じゃなく "&MMDDHHMM=" あたりを付加するようにできませんか? * 2.04版で、URLに"?"が入っているときには、"&huginn_lm=MMDDHHMM"を付加するようにしました。ただし、ロクにテストをしてませんのでよろしく。<span class='signature'>--2003/09/11 01:51 ynakata</span> * ありがとうございます。快調です。 これでだいぶ notimestamp を駆逐できました。--kto <hr /> <h2>データ取得方法についての覚え書き</h2> * (1) REMOTEによるデータインポート * 極力独自取得はしない:REMOTE優先 * REMOTE間では「メタ情報生成時刻が新しい方」を優先する目論見でコードを書きかけてロジック崩壊中の模様(--; * (2) HEADによるLast-Modifiedフィールドの取得 * (3) GETによるLast-Modifiedフィールド・文字列の取得 * (4) GETで取得した本文サイズのある程度以上(設定項目)の変更 * この場合、「最終未更新確認時刻(LNMD)」を更新時刻として設定 * LNMDは、通常前回の巡回時刻になるはず。 <hr /> データ保持形式についての[覚え書きなぞ書いてみた。 <hr /> <h2>文書更新検知方式について</h2> よくよく考えると俺様libgajafなんてものを抱えていて、あれの出力するハッシュ値は「文書に含まれている単語が似ていれば似てくる」という文書更新検知系にとってはなかなか優秀な性質を持っていたりするのですじゃよ。(実質長さで十分だとも思っているのだけど、一考の余地はありそう。)<span class='signature'>--2002/08/15 10:23 ynakata</span>