This page linked from [ CoverPage | dot.huginnrc | libhuginn ]

huginn

履歴閲覧: 最新 2016/05/12 2015/10/25 2015/10/24 2015/10/23 2015/10/23 2015/10/22 2015/10/22 2015/08/08 2015/05/01 2015/04/26 2015/04/19 2015/01/07 2014/10/17 2014/05/25 2014/04/09 2013/11/21 2013/11/21 2013/11/20 2013/11/20 2013/11/20 2013/11/19 2013/11/05 {2012/10/11[差分表示]} 2012/08/16 2012/08/16 2012/07/09 2009/06/03 2009/06/02 2007/01/04 2006/05/16 2005/09/24 2005/02/20 2004/04/08 2004/03/15 2004/03/15 2004/01/05 2004/01/02 2003/09/12


huginn(フギン)は、perl汎用のWorld Wide Web更新時刻取得システムです。

おしらせ.

ページの場所を変えました。http://white.niu.ne.jp/yapw/yapw.cgi/huginnが、今後の正式公開ページになります。

実行環境.

動作サンプル.

http://ynwhite.dyndns.org/~white/ にて、サンプルが動いてます。

最新版ダウンロード.

2.05版 tar.gz形式

内容物.


BBS.

動作報告 / エラー報告 / 設定よくわかんない / 機能要望 その他にどうぞ。


somebody(2012/10/11 23:16)yyzTWIPxwFxHMSgq?
ynakata(2012/08/16 19:14)TGtAHHcpjsXx?
somebody(2012/08/16 19:14)wOhZlViQsoolIk?
ynakata(2012/08/16 19:14)ZFHjgTww?
somebody(2012/08/16 19:13)AFWueNrCAkugg?
somebody(2012/08/16 06:43)WXCgiyhxqSjPAQg?
somebody(2012/07/09 03:33)pEOgoXZEjqCILkyoyUe?
久我瑞貴(2009/06/03 01:35)ynakata様へ。回答ありがとうございました。どうもシステムを根本的に勘違いしていたようです。ご迷惑をおかけしました。
ynakata(2009/06/02 11:29)huginnでやれるようなことをしたいのなら、はてなアンテナ http://a.hatena.ne.jp/ あたりを使えばいいんじゃないかと思います。もしくは最近ならRSSリーダーとか。
久我瑞貴(2009/06/02 11:08)サイトの更新をしたいのですが、最初から最後まで正直まったくわかりません。このhuginn以外で更新することはできないのでしょうか?
somebody(2005/02/20 22:42)


使い方.

  1. アーカイブを取得し、適当な場所で解凍。
  2. libhuginn,pm、huginn.confを、perl5のライブラリ読み取りパスに入れる。(PERL5LIB環境変数で設定する、適当なsite-perlディレクトリに入れる、スクリプト実行時に@INCで設定する、など)
  3. huginn.confを適当に書き変える。$resulthtmlとか$gzipとかがわりと重要。
  4. huginn.confで設定した場所に、'dot.huginnrc'を'.huginnrc'に改名して入れる。
  5. .huginnrcに、取得したいページのエントリを記述する。
  6. DateCheck.plを動かします。ネットワークにガシガシと負荷をかけながら、huginn.confで設定したいろんなファイルがごそごそと作られます。
  7. ちゃんと動作しているようなら、cronでぶん回すなり、定期的に手動で動かすなり、お好みに合わせて環境構築してください。

なんかめんどくさいと思ったら、.huginnrcだけホームディレクトリに置いて、他は全部同じディレクトリに放りこんでください。たぶんなんとかなります。
設定ファイルの記述方法については、サンプルをみて根性入れてください。あるいは、dot.huginnrcとかを見てもよいかと思います。よーわからんかったら質問してください。そうするとドキュメントが増えて幸せになれます。

書こうとするマクロが正しいもんかどうかは、huginn_testmacro.plでテストできます。% ./huginn_testmacro.pl 'マクロ'とかやってください。

利点.

同種のソフトと比べたときのアピールポイントみたいな

DateCheck.plのオプション.


-fullcheck (無指定時と同じ動作) リモート情報を取得し、リモートで取得できなかったページについてはHTTPのHEAD/GETメソッドを使って情報を取得します。
-nocheck 情報を取得せず、.huginnDBにキャッシュされた情報のみを使ってページを更新します。
-remoteonly リモート指定された取得先の情報のみを取得してから、ページを更新します。
-debug 動作時に、デバッグ出力を出すようにします。
-rcfile 標準の .huginnrc 以外のファイルをrcファイルとして指定します。

取得方法.

以下の順で更新時刻情報の取得を試します。

  1. リモート情報(hina.di、hina.txt、LIRS、huginnDB)
  2. HEADリクエストで取れる最終更新時刻
  3. GETリクエストで取得した本文中の、それっぽい文字列
  4. GETリクエストで取得した本文の長さの変化量

バカスカ出力が変わる困ったちゃんなiswebやらgeocitiesのためにそれ用のフィルタもあったりします。動作はあんまり保証しません。使い方は適当にどうぞ。

今後の予定.

開発状況.

名前の由来.

huginnは、北欧神話の神オーディン(Odin)の持つ二羽のカラスの片割れで、「思考」を象徴するものです。

権利表示.

huginn の改造・利用は基本的に自由です。ただし、改造の有無に関わらず、再配布の際には、取得者になんらかの形で原情報所在地へのポインタ(2004年1月2日現在:http://white.niu.ne.jp/yapw/yapw.cgi/huginn)を明示してください。