でぶててのWEB録

PPC広告とか!タグマネジメントとか!WEB解析とか!だいたいそこらへん。

【SEO/SEM】検索エンジンと形態素解析について、実験してみる(7)~検証その6~

※先のエントリー

  1. 序論
  2. 組み合わせと検証その1(漢字のみ)
  3. 検証その2(漢字×ひらがな、漢字×カタカナ)
  4. 検証その3(漢字×英語、漢字×数字)
  5. 検証その4(ひらがなのみ、ひらがな×カタカナ、ひらがな×英語、ひらがな×数字)
  6. 検証その5(カタカナのみ、カタカナ×英語、カタカナ×数字

前回から引き続き形態素解析の検証です。
今回で検証自体は最後になります。最後の検証は「英語」「英語×数字」「数字」の検証になります。


3.検証

3-13.英語

もちろん、「search engine marketing」

有料検索 search + engine + marketing
自然検索 search + engine + marketing

f:id:debutete:20131213022716p:plain

上記画像の通り、略称もbold表示されているが自然検索(オーガニック)のみであり、広告側ではbold表記されていない。しかも、今回は類語に相当するであろう「search engine optimization」もbold表記されている。

ここで、スペースなしの場合と略称を検索し場合を検証したい。


スペースなしの場合

f:id:debutete:20131213022732p:plain

自然検索結果、広告が非表示である、この2つの点より違う文字列として判定されていることがわかる。


略称の場合

f:id:debutete:20131213022747p:plain

本来の名称はboldされていない。この項の対象ではないが、表示URLはスペルが同じだけで違う単語にも関わらずbold化されている。しかし、OPECやASEANと検索すると本来の名称もbold化されている。
以上のことより、略称と本来の名称とが一致し、かつ同様の略称がない場合にbold表示になると考えられる。


3-14.英語×数字

密かに人気上昇中の「nexus 5」

有料検索 nexus + 5
自然検索 nexus + 5

f:id:debutete:20131213022802p:plain

今までの検証結果に準ずる結果となり、半角スペースがない「nexus5」では下記画像のように検索結果が異なることから、英語と数字の組み合わせの場合も英語と同様にスペースの有無が重要であることがわかる。

f:id:debutete:20131213022819p:plain


3-15.数字

英語と全く同様の結果を示したため、割愛。


仮説のまとめ・・・

と毎回書いておりますが、次回の記事がこの形態素解析のまとめおよび考察となるため、次回にご期待ください。



copy right 2012 でぶてて