検索エンジンの仕様をエンジニアの視点から考えてみた！

2019-06-21 mitosuya 0 Comment

検索エンジンの仕様をエンジニアの視点から考えてみた！

検索順位をあげたい。その検索エンジンの順位を決めるのはロボットです。

もし、自分が
「膨大なコンテンツから検索エンジンの順位を決めるロボットを作れ」
と言われたら、どういう仕様にしますか？

自分だったらどう作るか、Googleはどう作っているのかを推測しながら、検索エンジンの仕様について考えてみましょう。

構造的な指標

まずロボットが機械的に判断できる、構造的な指標を考えてみましょう。

キーワードが適切か
人間にもロボットにも解釈しやすい構造か
共起語や関連語が入っているか
記事の網羅性（文字数）は高いか
検索エンジンが理解できる記述か
ファーストビューの重要性
情報は新鮮か

それでは掘り下げていきます。

キーワードが適切か

まずはキーワード。1にも2にもキーワード。ユーザーが拾うキーワードが適切に入っているかということです。ロボットがキーワードとして拾うタグの優先順位は、下記のようなイメージでしょうか。

title
h1～h6
strong
em
その他

URLやmeta-title, meta-keyword, meta-descriptionも見るかもしれませんね。

逆にtitleタグにはキーワードを入れすぎていないか。または単語の羅列になっていないかも見るでしょう。感覚的な話ですが、キーワードは多くても3個まででないと上位表示が難しい気がします。
例えば、

「建売住宅 VS 注文住宅。それぞれ違いを比べてみた」

のようなタイトルであれば、コンテンツが他者より充実していれば
「建売住宅注文住宅違い」でヒットさせることができます。それが欲張って、

「建売住宅 VS 注文住宅。設備と立地の違いを比べてみた」

のように多くのキーワードをtitleに散りばめてしまうと、うまく順位があがりません。

人間にもロボットにも解釈しやすい構造か

1つの記事ページに対してカテゴリーを2つ以上設定しているなど、人間にもロボットにも解釈が難しい設定はしないようにしましょう。同様に、タグを無闇に増やさないことも大切です。
TwitterやInstgramなどのSNSを見ていると、#タグを滅多打ちして『引っかかったもん勝ち』みたいな投稿者がいますが、あれはSEO的にはNG。
設置したタグページが1記事しかないような場合は、タグを付けないほうが良いでしょう。

共起語や関連語が入っているか

そもそも共起語とはなにか？

共起語とは、主軸となるキーワード「A」に対して、関連性が強く一緒に用いられる頻度が高い単語「B」のことです。キーワード「A」の周囲によく現れる単語とも言えます。「B」にあたる単語は1つではなく、複数存在します。

たとえば、「動画」というキーワードで作成されたあるコンテンツを見てみると、同じページ上に「再生」「YouTube」「ニュース」「音楽」「配信」といった単語が頻繁に出ています。このようにキーワードと一緒に使われる単語が共起語です。

出典元：ContentSearch – 共起語分析ツール

その共起語がタイトルや本文に入っているか？ということ。Googleは共起語をデータベースに持っています。一定数以上のユーザーが入力するキーワードから独自に算出するアルゴリズムになっているのでしょう。
その共起語の出現が多く、共起語についても掘り下げられているような記事なら、人間から見てもロボットから見ても『この記事は〇〇について詳しい』という評価を獲得することができます。

記事の網羅性（文字数）は高いか

次に記事の網羅性≒文字数。個人的に調べもの系の記事は、長い＝良いとは思いません。しかし、ロボットにはその短い要点だけの記事が、他のライバル記事より優れていることを知る術がない。よって判断には文字数が少ないコンテンツは、コンテンツだけでなく、サイトの評価が関わってきます（辞書サイト、Wikiなど）
また、情報を掘り下げていくとある程度の文字数は必要になります。感覚的にいうところ少なくても2,000文字以上、レッドオーシャンでは4,000文字以上でしょうか。

検索エンジンが理解できる記述か

これは単純な話ですが、人間には雰囲気的に伝わる文字でも、ロボットに伝わりにくい文字は使用しないということ。
具体的には「！！！」、「。。。。」「orz」「（゜∴ω∴;゜）」など。ビックリマーク（！）が多いことは、人間にはその分衝撃が大きいことを察することができますが、乱用することで、ロボットは評価基準を見失うことにつながりかねないのです。

ファーストビューの重要性

これはGoogleが2012年に行った『ページレイアウト・アルゴリズムの更新』で名言してます。ファーストビューに十分なコンテンツを持たず、広告が画面の大部分を占めるようなページは順位を落としますよ、ということ。広告が一番見られる場所ではありますが、記事を開いて画面が広告でほぼ埋まっていたらユーザーの印象はどうなるでしょうか。うざったく感じますよね。
ファーストビューのまとめは下記のとおり。

広告は置かない（特にモバイル）
冒頭文で記事の掴みがわかること

情報は新鮮か

検索エンジンが、情報が古いかどうか判断する方法は2つ。

記事の更新日
記事の情報

例えば「Android 不具合対策方法」というクエリに対して、数年前の更新日で「Android 4.0」の不具合対策方法を書いても、関連性が薄いことは猿でもわかります。対策は、記事ページを最新の情報に対応させるか、最新の情報用の記事を書くかの2択になります。

ユーザーの行動指標

続いてはユーザーの行動から記事の良し悪しを判断するという取り組み。これは間違いなく検索エンジンは行っているでしょう。
ぼくがエンジニアだったらロボットに集めさせる情報は下記のとおり。

記事の滞在時間
サイトの回遊率
セッションを閉じる

記事の滞在時間

記事の滞在時間が長いこと。すぐに検索結果に戻るようなページは低品質決定です。
前述した記事の網羅性（文字数）の部分とも重なりますが、『欲しい情報だけ見つけて即終了』が本来良い情報サイトだと思いますが、網羅性という観点からは検索エンジン的には低評価になってしまいます。

コンテンツを充実させて、すぐ離脱されるような低品質でないことの証明をしましょう。

サイトの回遊率

検索エンジンからの流入の場合、絶対に何かしらのキーワードで検索して記事にたどり着きます。
そのキーワードに、関連深い情報がたくさんあったらどうでしょう？ユーザーは他のページも見ますよね。
例えば、

「プリウス燃費」

というキーワードで訪れた人が、当該ページ以外にもプリウスのランニングコストに触れているページが関連記事として紹介されれば見たくなりますよね？そういうサイトは検索エンジンからも評価が高くなります。

特定のクエリでたどり着く⇒他の記事も見るが、ユーザーにとってもロボットにとっても高評価なことは間違いありません。

セッションを閉じる

欲しい情報を得て満足したユーザーが取る行動は、「ブラウザを閉じる」です。これはぼくが愛読した「のんくら本」に記載されていました。

Google AdSense マネタイズの教科書[完全版]

created by Rinker

ブラウザを閉じてセッションを終了したユーザーが多ければ満足（解決）した記事。その逆が不満な記事です。その逆とは、「同じクエリの検索結果に戻って他のページを見る」という行動。これはおそらく最悪で、今後このあたりの行動が今まで以上に順位に反映される可能性があります。ユーザーの行動こそがユーザーエクスペリエンスそのものだからです。

以上が、ぼくが検索エンジンを作るとしたら、組み込む仕様です。
きっと大きくは外れてないはず。異論は認めます。

検索エンジンの仕様をエンジニアの視点から考えてみた！