昨日の日記の、漢字コードの件について、掲示板にてO.C.T.さんから、
1文字3バイトの文字コードですが、UTF-8(Unicode)だと思います。との情報が。
…しかし、昨日の日記を書いた時点で、
「JISでもシフトJISでもEUCでもなければ、あと思い浮かぶのはユニコードくらいしかないけど、これがユニコードかどうかを調べる方法がないしなあ。仮にこれがユニコードだとしても、jcode.plではユニコードを変換する事が出来ないしなあ…」
などと思っていたのですが、その掲示板情報の続き、
jcode.pm???
さっそく検索すると、トップに出てきたサイトに問題のjcode.pmがありました。で、ダウンロードして設置。
解凍したファイルまとめてCGIあるのと同じ階層に放り込んでアクセス権の設定して、あとはjcode.plから移行する場合のソースの変更施して試してみたら、…動きましたよ!
びっくりですよ!私が未だにjcode.plでちまちまコード変換していた間に、人類の科学力はもうユニコードの変換までも実現してましたか!
で、これならあとは検索サイトごとに検索ワード部分を判別して抜き取るスクリプトを作ればいいんだけど、この作業ちょっと面倒だなあ…とか思っていたら、O.C.T.さんが自身のサイトにてこの件に触れていて、しかもそこで公開されているソースには、まさに私がやりたかった、検索サイトごとに検索ワードを抜き出すという処理がそのものズバリ入っていました!
…特にこのソースを使用する上での規約等は書かれていませんでしたが…使ってもいいですか?いいですか?いいですよね?というかもう使っちゃいました。で、このおかげでいともあっさり
『検索サイト経由で来たときには、その検索ワードがそのまま過去日記検索の検索窓に出現』
が実現出来てしまいました。
猛烈に事後承諾ですが(汗)、O.C.T.さんありがとうございました!
…ただ、まだ多少の問題はあって、ウチの過去日記検索は複数語検索に対応していなくて、単語の間にスペースが入っていても、それも単語の一部と解釈して検索してしまうので、and検索で来た人が過去日記検索をしても検索結果が0件になってしまうという問題が。
まあ、これは今後なんとかしよう。
ともかくこれで、また野望がひとつ達成されました。