トップに戻る

過去日記

2002年6月18日(火):昼

野望達成(あっさりと)。

 昨日の日記の、漢字コードの件について、掲示板にてO.C.T.さんから、

1文字3バイトの文字コードですが、UTF-8(Unicode)だと思います。

との情報が。
 …しかし、昨日の日記を書いた時点で、
「JISでもシフトJISでもEUCでもなければ、あと思い浮かぶのはユニコードくらいしかないけど、これがユニコードかどうかを調べる方法がないしなあ。仮にこれがユニコードだとしても、jcode.plではユニコードを変換する事が出来ないしなあ…」
 などと思っていたのですが、その掲示板情報の続き、

jcode.pm使えばデコードできたと思います。

 jcode.pm???

 さっそく検索すると、トップに出てきたサイトに問題のjcode.pmがありました。で、ダウンロードして設置。

 解凍したファイルまとめてCGIあるのと同じ階層に放り込んでアクセス権の設定して、あとはjcode.plから移行する場合のソースの変更施して試してみたら、…動きましたよ!
 びっくりですよ!私が未だにjcode.plでちまちまコード変換していた間に、人類の科学力はもうユニコードの変換までも実現してましたか!

 で、これならあとは検索サイトごとに検索ワード部分を判別して抜き取るスクリプトを作ればいいんだけど、この作業ちょっと面倒だなあ…とか思っていたら、O.C.T.さんが自身のサイトにてこの件に触れていて、しかもそこで公開されているソースには、まさに私がやりたかった、検索サイトごとに検索ワードを抜き出すという処理がそのものズバリ入っていました!

 …特にこのソースを使用する上での規約等は書かれていませんでしたが…使ってもいいですか?いいですか?いいですよね?というかもう使っちゃいました。で、このおかげでいともあっさり
『検索サイト経由で来たときには、その検索ワードがそのまま過去日記検索の検索窓に出現』
が実現出来てしまいました。
 猛烈に事後承諾ですが(汗)、O.C.T.さんありがとうございました!

 …ただ、まだ多少の問題はあって、ウチの過去日記検索は複数語検索に対応していなくて、単語の間にスペースが入っていても、それも単語の一部と解釈して検索してしまうので、and検索で来た人が過去日記検索をしても検索結果が0件になってしまうという問題が。
 まあ、これは今後なんとかしよう。

 ともかくこれで、また野望がひとつ達成されました。

前後の過去日記

↑2002年6月18日(火):夕方

過去日記検索対策それから。

↓2002年6月17日(月):深夜

具体例?

過去日記一覧
トップに戻る