WordPressのURLが難しい

WordPressでURL引用をすると

865f02bd0a62fc2d002e698228aa05c5

相手がWordPressで書かれているとこのようにページ名、アイコン、コメント数などが表示されます。

相手がWordPress出ないと利用できない機能なので通常のhtmlはできませんが、この機能は引用するときは便利ですが、ちょっとした問題がありました。

私のブログはサイトのアイコンを変更しているので変更したものが表示されますが、変更していない場合はWordPress標準のものが使われます。

w-logo-blue
こんなの↑

これがちょっとしたGoogleBotと問題になりましたよ..

GoogleBot

まずGoogleBotとは、様々なサイトを機械的に見て回るプログラムです。

Googleで検索して結果が出るのはGoogleBotが見て回り、検索結果として出していいもののみを探し出します。

GoogleBotは家庭訪問ではありませんのでいつ来るかわかりません。

サイトに来てほしいページや来てほしくないページがあった場合どうしましょうか

そのような時にrobots.txtというファイルでコントロールします。

robots.txt

GoogleBotに限らず自動クロール系はこのファイルを見ます。

ここに来てほしくないサイトを書けば、robots.txtにブロックされたとしていきません。

WordPressはプログラムによって動いています。その中には核心的存在のものもあります。

よって来てほしくないページ(フォルダ)としてrobots.txtに書きます(自動で書かれるけどね)

ここで問題が起きます。

  • 標準のファイルはこのrobots.txtに来てほしくないとして書かれます。
  • 標準のファイルの中にデフォルトのサイトのアイコンが含まれます。
  • サイトのアイコンを指定していないサイトは標準ファイルのアイコンが使われます。
  • GoogleBotは来てほしくないと書かれていないものはアクセスしようとします。

結果、サイトの表示上問題はありませんが、引用したサイトとしては表示されてしまう部分で引用したサイトに読み込みできないよと警告が来てしまいます。

解決策

サイトのアイコンを変える

変えればデフォルトのアイコンが使われなくなります。ですが、外部のサイトに対して、Googleうるさいからアイコン変えてくれとか言ったら怒られます。

URLを消す

消してしまえばある意味解決ですが、解決にはなりませんし、不足分を引用して補っている場合わからないことだらけになってしまいます。

URLに対して「行かなくてもいいよ」とフラグを付ける

よくnofollow属性というものを付けろと言いますが、URLに対しても有効です。ですが、HTMLタグを利用して付けた場合にできますが、WordPressはどうもURLに対しての動きが違います。

今回の対策

上の対策例では解決できません。ほかの方法があるか調べる必要がありそうですね。

今回Googleに怒られたページはさほど重要性がない(気がする)ので少し様子を見ることにします。

コメントする