【SEO/SEM】検索エンジンと形態素解析について、実験してみる(7)~検証その6~
※先のエントリー
- 序論
- 組み合わせと検証その1(漢字のみ)
- 検証その2(漢字×ひらがな、漢字×カタカナ)
- 検証その3(漢字×英語、漢字×数字)
- 検証その4(ひらがなのみ、ひらがな×カタカナ、ひらがな×英語、ひらがな×数字)
- 検証その5(カタカナのみ、カタカナ×英語、カタカナ×数字
前回から引き続き形態素解析の検証です。
今回で検証自体は最後になります。最後の検証は「英語」「英語×数字」「数字」の検証になります。
3.検証
3-13.英語
もちろん、「search engine marketing」
有料検索 | search + engine + marketing |
自然検索 | search + engine + marketing |
上記画像の通り、略称もbold表示されているが自然検索(オーガニック)のみであり、広告側ではbold表記されていない。しかも、今回は類語に相当するであろう「search engine optimization」もbold表記されている。
ここで、スペースなしの場合と略称を検索し場合を検証したい。
スペースなしの場合
自然検索結果、広告が非表示である、この2つの点より違う文字列として判定されていることがわかる。
略称の場合
本来の名称はboldされていない。この項の対象ではないが、表示URLはスペルが同じだけで違う単語にも関わらずbold化されている。しかし、OPECやASEANと検索すると本来の名称もbold化されている。
以上のことより、略称と本来の名称とが一致し、かつ同様の略称がない場合にbold表示になると考えられる。
3-14.英語×数字
密かに人気上昇中の「nexus 5」
有料検索 | nexus + 5 |
自然検索 | nexus + 5 |
今までの検証結果に準ずる結果となり、半角スペースがない「nexus5」では下記画像のように検索結果が異なることから、英語と数字の組み合わせの場合も英語と同様にスペースの有無が重要であることがわかる。
3-15.数字
英語と全く同様の結果を示したため、割愛。
仮説のまとめ・・・
と毎回書いておりますが、次回の記事がこの形態素解析のまとめおよび考察となるため、次回にご期待ください。