dot.huginnrc
履歴閲覧: {最新} 2004/06/11 2003/08/24
libhuginn用の設定ファイルです。
.huginnrc書き方
質問があったら追加されます。むしろ質問しなければ追加されないと思え。
- #から始まる行はコメントアウト
- 空行があってもぜんぜん平気
- エントリは同一行に。
- リモート用設定項目
-
取得対象ページ用設定項目
- ref(必須。対象サイトのURL。マクロが使える)
- title(出力用のサイトのtitle。リモート情報にあっさり上書きされる)
-
filter
ころころ文書サイズの変わる/日付記述が非標準的な困ったちゃんサイト対策用フィルタ指定。
filter="(フィルタ名)"と指定すると、時刻取得の際に指定されたフィルタを使います。
フィルタ定義はhuginn.confの中で行っています。デフォルトでは以下のものを用意。- isweb用
- geocities用
- slashcode用
-
noremote(リモート取得解除オプション。自力取得を強要する。
ex: noremote="1" -
notimestamp (HTML出力時に、タイムスタンプ文字を付けない)
ex: notimestamp="1" -
vuri (refで指定したアドレスの代わりに、vuriで指定したアドレスをチェックに用いる)
- vuri="2ch:" (2ch.net用。refで指定したページに対応するdatファイルでチェックする)
- 他の項目は書いても無視なので、実はコメント代わりに利用できたりする。
- フィルタ追加
- フィルタは結構トリッキーなコードで実現されています。手を出すにはPerl5の関数リファレンスの知識が必要。
-
マクロ
-
作者ですらソース見ないと思い出せない有り様ですが一応説明。
- %2y 西暦下2桁
- %y 西暦4桁
- %m 月を数字で 1-12
- %0m 月を数字で01-12(頭に0が付く)
- %M 月をアルファベット3文字で。
- %d 日を数字で1-31
- %0d 日を数字で01-31(頭に0が付く)
- %[...] ...をPerlでevalするという危険な技。なにをしでかすかわからないので、素人にはお勧めできない。便利だけど。
- %(...) 上に同じ。
- %{...} 上に同じ。
- 他に頻用するパターンがあれば要望ください。
上旬中旬下旬でファイル名が違ったりするとき。
上旬中旬下旬でabcとか使い分けてる場合には、%{substr("abcc",int(%d / 10),1)}やら%{(qw(a b c c))[int(%d / 10)]}とか書くと幸せになれるかと思います。(結構多用するんでそのうちそんなマクロにまとめるかもですが。)