時代は検索だ!

ということで、自宅のHikiEstraierを導入してみた。
Estraierのインストール自体はすんなりいったのだが、Hikiのデータファイル(以下、Hikiテキスト)に対応させるのが面倒であった。
以下苦労の履歴

  1. Hikiテキストのファイル名はURIエスケープされていて、検索結果にそのままタイトルとして表示されても意味わかんない。
  2. タイトルとして表示されるものは普通の文字がええな。
  3. estindex registerはHTMLファイルを解析する場合は、title要素の中を読んでタイトルにしてくれるらしい。これを使おう。title要素の中にはエスケープ解除した文字列をいれとけば解決だ!
  4. HikiテキストをHTMLに変換するフィルタを書いた。
  5. estindex register -xsufオプションに指定してみた。
  6. なんと、estindexはフィルタに元のファイル名を渡してくれない。
  7. Hikiテキストでは、ファイル名にしかタイトルを保持していない。従って、フィルタでは対応できない
  8. Hikiテキストに一括前処理をかまして、ファイル名をTitle属性に持つHTMLを生成することにした。
  9. それらHTMLファイルをestindexに読ませることでようやく期待通りに動いた。

えーと、けっこう大変でした。素直にHikiwgetしてきたHTMLファイルに対して検索かけるほうが早かったかなあ。
にしても、やっぱファイル名だけにページ名を保存するのはちょっといただけない、という思いを強くしたsshiなのでした。まる。