noindexタグは、Googleなど検索エンジンにインデックスされなくなる(検索結果に表示されなくなる)ためにつけるものですが、さまざまな理由により付ける機会が多くあります。

Wordpressの場合は、プラグインのAll in One SEO Packがあれば簡単に設定できます。また、このブログのテーマは賢威を使っていますが、賢威も記事ごとにチェック1つでnoindex設定ができます。

 

ただし、あまりnoindexを付けすぎると、

「どの記事に付けたか忘れた…」

ということになりかねません。

特に、ブログの記事が増えると、質の良くない記事を一旦noindexにしておき、あとからリライトなどで作り変えようと思ったときにも、「そもそも対象の記事はどれだっけ?」となってしまいます。

 

今回はプラグインやアドオンを使わずに、noindexの記事を探す方法を紹介します。

 

 


スポンサーリンク

サクラエディタのglep機能で探すことができる

今回使用するツールは、「サクラエディタ」(とExcel)です。サクラエディタは正規表現やglep機能を使うことができる便利なフリーのテキストツールですが、これらの機能を駆使して、noindexの記事を探すことができます。

 

記事一覧をエクスポートする

※手順の前に、下書きの記事が無い状態にしてください。下書き記事があるとうまくいきません。

 

まず始めに、Wordpress内の記事をエクスポートします。

画面左の「ツール」→「エクスポート」→「投稿」のラジオボタンを選択して、「エクスポートファイルをダウンロード」

これを、任意のフォルダに保存します(好きな場所でいいですが、分かりやすい場所に保存してください)

 

 

次に、サクラエディタを開き、Ctrl+Gでglepウィンドウを開きます。このようなウィンドウが開けばOKです。「フォルダ」には、先ほどエクスポートファイルを保存したフォルダを選択します。

 

 

タイトルを抽出する

タイトルは、<title></title>というタグに挟まれています。glepの条件に、<title>を設定します。

 

 

出力結果は以下のようになります。

 

 

出力結果を加工してExcelに貼り付ける

サクラエディタの別ウィンドウを開き、先ほどの出力結果を貼り付けます。なお、上の画像の<title>halice</title>のように、ブログ名は無視してだいじょうぶです。

 

次に、Ctrl+Rで置換ウィンドウを開き、以下のように置換してタイトルだけを抽出します。

置換1回目

置換前:.*<title>
置換後:空欄

置換2回目

置換前:</title>
置換後:空欄

すると、以下のようになります。

 

これをExcelに貼り付けます。

 

 

index/noindexタグを抽出する

インデックスされている記事の場合は、
<wp:meta_value><![CDATA[index]]></wp:meta_value>

 

インデックスされていない記事の場合は、
<wp:meta_value><![CDATA[noindex]]></wp:meta_value>

 

というタグがついています。両者の違いは、noがついているかどうかだけです。

 

glepで、以下のように抽出します。

条件:<wp:meta_value><!\[CDATA\[(no)*index\]\]>

※”[“と”]”はメタ文字のため、先頭に\をつけて回避させます。indexとnoindexの違いは、noがついているかどうかだけなので、noの0回以上の繰り返しを指定します。「(no)?」でも可です。正規表現の基本的な使い方を一覧にした

 

出力結果は以下のようになります。

 

 

出力結果を加工しExcelに貼り付ける

タイトルと同様に、サクラエディタの別ウィンドウを開き、先ほどの出力結果を貼り付けます。indexタグは以下のように置換します。

置換1回目

置換前:.*\[
置換後:空欄

 

置換2回目

置換前:\].*
置換後:空欄

 

結果は以下のようになります。

 

これを、先ほどのExcelファイルに貼り付けます。最終的にはこのような形になります。

 

このエクセルファイルが、記事名と、その記事のindexの状態を表してくれます。なお、タイトルが空欄の記事は、ごみ箱に入っている記事です。

 

 

補足:エクスポートファイルの形式

エクスポートファイルには、Wordpress内のすべての記事が1つのXMLファイルに記載されています。1つの記事は<item>というタグに囲まれており、

<item>
<title>記事名</title>




<wp:postmeta>
<wp:meta_key><![CDATA[index]]></wp:meta_key>
<wp:meta_value><![CDATA[index]]></wp:meta_value>
</wp:postmeta>



</item>

という形になっています。これが記事分だけ連なっています。

タイトル名とindexタグの順番は変わらないので、上の手順で加工してやれば、上のような表が作成できます。



スポンサーリンク


Facebook いいね!/Twitterフォローお願いします