時代は検索だ!
ということで、自宅のHikiにEstraierを導入してみた。
Estraierのインストール自体はすんなりいったのだが、Hikiのデータファイル(以下、Hikiテキスト)に対応させるのが面倒であった。
以下苦労の履歴
- Hikiテキストのファイル名はURIエスケープされていて、検索結果にそのままタイトルとして表示されても意味わかんない。
- タイトルとして表示されるものは普通の文字がええな。
- estindex registerはHTMLファイルを解析する場合は、title要素の中を読んでタイトルにしてくれるらしい。これを使おう。title要素の中にはエスケープ解除した文字列をいれとけば解決だ!
- HikiテキストをHTMLに変換するフィルタを書いた。
- estindex register -xsufオプションに指定してみた。
- なんと、estindexはフィルタに元のファイル名を渡してくれない。
- Hikiテキストでは、ファイル名にしかタイトルを保持していない。従って、フィルタでは対応できない
- Hikiテキストに一括前処理をかまして、ファイル名をTitle属性に持つHTMLを生成することにした。
- それらHTMLファイルをestindexに読ませることでようやく期待通りに動いた。
えーと、けっこう大変でした。素直にHikiをwgetしてきたHTMLファイルに対して検索かけるほうが早かったかなあ。
にしても、やっぱファイル名だけにページ名を保存するのはちょっといただけない、という思いを強くしたsshiなのでした。まる。