●2006年09月25日(月)
限界? 解析なんてできません そんな時間もありまっせん というわけでダメかなーーー? - xlhtml が - 「The Maximum Number of Columns was exceeded, - you might want to increase it.」と言っているので、 - Column の最大値を超えているようです。 何の話かというと namazu検索結果検証において露見した問題点ということ xlhtmlを使ってexcel→html変換というわけですが 実際に検索結果の「ゆらぎ」が見られるexcelファイルを(ex. シート数が多いファイル等) html変換してみると、文字データがほとんど欠落している… ということは鯰君は、イントラデータ検索用(office文書山盛り…)には問題ありってことか〜? office文書内のオブジェクトも検出しないことも判ってるし あと、kakasiの挙動にも問題あり このページで試してみたら面白い結果が出ました ただし回避策はあって 「*検索キーワード*」とすれば、kakasiの分かち書きの癖が原因で検索結果から省かれた文書も検出されます。 ------------------ と、こんだけ書いておけば、忘れんだろー。
|