This page linked from [ huginn | libhuginn ]

dot.huginnrc

履歴閲覧: 最新 2004/06/11 {2003/08/24[差分表示]}


 libhuginn用の設定ファイルです。
 
 <h2>.huginnrc書き方</h2>
 質問があったら追加されます。むしろ質問しなければ追加されないと思え。
 
  * #から始まる行はコメントアウト
  * 空行があってもぜんぜん平気
  * エントリは同一行に。
  * リモート用設定項目
    * remote(必須。対象サイトのURL)
    * sig(内部でこっそり使ってる。実はなくても困らない)
    * type(なくても自動判別するはずだが、あると安心) = LIRS / HinaDi / huginnDB/ hina.txt
  * 取得対象ページ用設定項目
    * ref(必須。対象サイトのURL。マクロが使える)
    * title(出力用のサイトのtitle。リモート情報にあっさり上書きされる)
    * filter
      ころころ文書サイズの変わる/日付記述が非標準的な困ったちゃんサイト対策用フィルタ指定。
      filter="(フィルタ名)"と指定すると、時刻取得の際に指定されたフィルタを使います。
      フィルタ定義はhuginn.confの中で行っています。デフォルトでは以下のものを用意。
      * isweb用 
      * geocities用
      * slashcode用
-   * noremote(リモート取得解除オプション。自力取得を強要する)
+     これ以外のどこか用のフィルターが欲しければ要望を出すといいかもしれません。
+   * noremote(リモート取得解除オプション。自力取得を強要する。
      ex: noremote="1"
    * notimestamp (HTML出力時に、タイムスタンプ文字を付けない)
      ex: notimestamp="1"
+   * vuri (refで指定したアドレスの代わりに、vuriで指定したアドレスをチェックに用いる)
+     * vuri="2ch:" (2ch.net用。refで指定したページに対応するdatファイルでチェックする)
  * 他の項目は書いても無視なので、実はコメント代わりに利用できたりする。
 
 <dl>
 <dt>フィルタ追加</dt>
 <dd>フィルタは結構トリッキーなコードで実現されています。手を出すにはPerl5の関数リファレンスの知識が必要。</dd>
 <dt>マクロ<dt>
 <dd>作者ですらソース見ないと思い出せない有り様ですが一応説明。
   * %2y 西暦下2桁
   * %y  西暦4桁
   * %m  月を数字で 1-12
   * %0m 月を数字で01-12(頭に0が付く)
   * %M  月をアルファベット3文字で。
   * %d 日を数字で1-31
   * %0d 日を数字で01-31(頭に0が付く)
   * %[...] ...をPerlでevalするという危険な技。なにをしでかすかわからないので、素人にはお勧めできない。便利だけど。
   * %(...) 上に同じ。
   * %{...} 上に同じ。
 </dd>
+<dd>他に頻用するパターンがあれば要望ください。</dd>
 </dl>
 <h3>上旬中旬下旬でファイル名が違ったりするとき。</h3>
 上旬中旬下旬でabcとか使い分けてる場合には、<b>%{substr("abcc",int(%d / 10),1)}</b>やら<b>%{(qw(a b c c))[int(%d / 10)]}</b>とか書くと幸せになれるかと思います。(結構多用するんでそのうちそんなマクロにまとめるかもですが。)
 <hr />