WordPressサイト内検索に、一見全く関係なさそうな記事が出てくる「ゴルゴ問題」 – 運営堂サイト裏話(4)

運営堂さんサイトリニューアルにあたって苦労したところを書き残しておくシリーズの4つ目です。

WordPressにはブログ内検索機能がありますが、あくまでブログ用のデータベースの中をさらって結果を返してきているだけなので、正式な検索用途として作り込まれているわけではない簡易的なものであることを忘れてはいけません。
以下は、それを忘れ去っていたために、しばらく悶々とした日々を送った私の夏の思い出です。

「ゴルゴ問題」発覚の経緯

だいたいWordPress案件をやる時は、必要なテンプレートが一通り揃ったところで、search.phpがちゃんと適用できているか試すために適当な語句でブログ内検索をかけたりしますよね。

で、運営堂さんのサイトで、適度に結果としてでてきそうな言葉として、こんな感じでチェックしていたのです。

『ゴルゴ』の検索結果

大丈夫そうだなーと思ってスクロールしていったら、「ゴルゴ」の検索結果にこの記事が。

 

なんでこの記事が「ゴルゴ」で引っかかってくるんじゃい!

 

たしかにあのゴルゴのことを指していた記事もヒットしていますが、明らかにゴルゴ関係ない記事も検索結果に出てきてしまっているということに、制作も終盤になって気付いてしまったのです。

リンク先を見ていただくとわかりますが、「ゴルゴ」なんてどこにも書いてありません。

見なかったことにしようかと思いました。

でも、できなかったので、とりあえずTwitterにぼそりと。

そしたら、すぐに有益な情報が返ってきました。

そうか、自分で作ったWordPressテーマやプラグインだけ見ててもだめだ、コアとMySQLでどんな処理をしてるのか見てやらないと。ありがとう@sqmさん!

ということで、発行されてるクエリを確認してみることにしました。
この手のデバッグには、Debug This プラグインがお手軽です。

Debug This

Debug This プラグインを有効化しているとツールバーのところに[Debug This]というのが増えますので、例の「ゴルゴ」の検索結果ページで[Debug This]を押してみます。

すると、こんな感じで投稿オブジェクトの中身を一気に確認できます。

ブログ内検索のSQLはこのあたりですね。

たしかに、投稿データをMySQLのLIKE句で検索しています。

MySQLのLIKE句は、「大文字・小文字、清音・濁音・半濁音」を区別しない、ということで…(※照合順序はutf8mb4_unicode_ci )

つまりどういうことかというと、「ゴルゴ」で検索すると「こるこ」とか「こるご」とか「ごるこ」などのワードでも引っかかっていた、ってことでした。

例の記事を確認してみますと、

数日、数週間、または数か月という期間で起こることもあります。

制作会社さんからすると数あるタグの中の1つという感覚なのでここで行き違いが起こることが多いです。

そういうことかー!
「起こること」という言葉の「こるこ」の部分が、「ゴルゴ」と一致判定されていたのでした。

おおよその原因がわかったことで、同じような問題に遭遇している人の情報を見つけることができました。

そしたら芋づる式にいろいろわかりました。以下まとめです。

■どう対策するか?

→LIKE句検索を、LIKE BINARY句検索に変更してみました。

変わりました。

検索結果も安定しました。

■前のサイトではこの問題が起きていなかったっぽいが?

→MySQLのバージョン・照合順序の違い(utf8_general_ci → utf8mb4_unicode_ci)と思われます。

■これによる弊害

→全角・半角など完全一致でないと検索できなくなるのがネック。
(例)「iphone」「IPHONE」「iphone」、「さくら」「サクラ」などが区別される

とりあえず今は完全一致にしておりますが、今後の運用で、やはり「完全一致では使い勝手が悪い!”Google Analytics”と”google analytics”は同じものとして扱ってくれよ!」という話になってくれば、標準仕様のLIKE句検索に戻すかもしれません。

でも、仕組みを知っておけば今後悩まなくて済みますね。

 
これが運営堂さんサイトリニューアルにおける「ゴルゴ問題」の顛末でした。


以上、今回のリニューアルプロジェクトで苦労した4点を書き残しました。

かなりニッチな状況だと思いますので、これをお読みの方々に役に立つかどうかはまったくもって不明ですが、私自身はものすごく勉強になりました。

特に、

  1. 他社さんが普段どういう感じでプロジェクトを進めたり、どういうコーディング・実装をしているのか知れたこと
  2. 今まで先人たちが散々「困ったらコアを読め」と啓蒙してきたように、ググるのに時間使うより、結局コアファイルを検索したほうが早いという経験をできたこと
  3. なんとか自分もそこまでのレベルにようやくたどり着いていたことに気づけたこと

は、今後の私のWordPressライフにおいて非常に大きな糧となったと思います。

・・・と、締めくくろうとしていますが、実はまだAMP, PWAなどへの対応や、自作プラグインの機能拡張などといった残タスクがいくつもあります。
特にPWAについてはまだわからないことだらけなので、運営堂さんサイトを実験台にさせてもらいながら、またいろいろ学んでいきたいと思っています。

そしてさらにもう1つ。
今回導入したメールフォームについて、ぜひ紹介したいと思っています。これはかなりのこだわりの逸品なので!
しばしお待ちください。

今年に入ってパッタリ更新が止まっていましたが、WordFes前に更新できてよかった。。。

コメントをどうぞ

メールアドレス (必須・公開されません)
コメント本文

  • スパム・迷惑コメント投稿防止のため、メールアドレスの入力が必須ですが、公開はされません。何卒ご協力のほどお願いいたします。
  • 投稿いただいたコメントは管理者のチェック後掲載しておりますので、即時には反映されません。
  • 記載内容に関する批判や間違いの指摘などはそのまま掲載する方針ですが、投稿内容と無関係な誹謗中傷、一方的な罵詈雑言の場合は削除させていただく可能性があります。
  • 通常業務の合間にコメントチェックをしておりますので、すべてのコメントへのお返事が出来ない場合もございます。あらかじめご了承ください。
  • 管理人個人への連絡等は、コメント欄ではなくコンタクトフォームをご利用ください。

書籍を執筆しました

WordPress 標準デザイン講座【Version 4.x対応】


翔泳社さんより、2015/02/27発売しました。3年近く経ちますのでもう賞味期限切れだとは思いますが、一応実績として...

寄付歓迎(・ω<)☆

当ブログの記事があなたの役に立ったら、気が向いたらでいいのでドネーションいただけると更新の励みになります!
気が向いた方はこちらから

ブログ内検索