【SEO/SEM】検索エンジンと形態素解析について、実験してみる(5)~検証その4~
※先のエントリー
今回は、ひらがな、ひらがな×カタカナ(略称を含む)、ひらがな×英語、ひらがな×数字の検証をします。
3.検証
3-6.ひらがな
今回の検索クエリは、「そば」。蕎麦好きだから、そば。
有料検索 | そば |
自然検索 | そば |
今回はYahoo!側の検索結果画面であるが、今までの検証の仮説通り文字種(ひらがな、カタカナ、漢字)が違っていてもbold表示されている。サジェストキーワード(虫眼鏡キーワード)も同様である。しかし、Googleとの表示での違いとしてYahoo!MAPが表示された際にエリアIPに関係している箇所がboldされている。
3-7.ひらがな×カタカナ
ワインがおいしい季節になったので、検索クエリは「おいしいワイン」
有料検索 | おいしい + ワイン |
自然検索 | おいしい + ワイン |
「ひらがな×カタカナ」の掛け合わせでも仮説通り、同じ読みの字としてboldされている。
次に、「ももいろクローバー」で検証する。
口語では「ももクロ」と略することが多いため、略称でもboldされるのかを検証したい。
有料検索 | ももいろ + クローバー |
自然検索 | ももいろ + クローバー |
ももいろクローバーzの略称である「ももクロ」もboldされている。
amazon広告が右枠に表示されているが、広告では「もも クロ」と分割されていることがわかる。
3-8.ひらがな×英語
検索クエリは「なんj」
有料検索 | -- |
自然検索 | なん + j |
有料検索枠が表示されなかったので、有料検索は割愛。
自然検索では上記画像のように、「なんJ PRIDE」と「なんJPRIDE」とでは、bold表示が異なる。このことより「JPRIDE」と連続した文字列になった場合、一単語と認識されているといえる。より詳細については、英語の検索クエリの項で説明する。
3-9.ひらがな×数字
検索クエリは、「1か月」
有料検索 | 1 + か +月 |
自然検索 | 1 + か +月 |
過去の検証と同様、Wikipediaは傾向が違うが自然検索および有料検索は「数字とひらがな」が分離されている。経験上、有料検索の場合は数字とひらがな・カタカナ・漢字は分離されているため、検証結果と同じ結果となる。
ここまでの結論の仮説
- 検索エンジンに非依存のパターン
- 有料検索(Yahoo!プロモーション/Googleアドワーズ)と自然検索(オーガニック)では、形態素解析が異なる。
- 形態素解析の判定は、スペースも考慮される場合がある(スペースあり/なしで別単語と認識される場合に限る)
- 数字とひらがな・カタカナ・漢字での組み合わせの場合、数字とそれ以外に分離する。
- 英語で2語以上の組み合わせの場合、スペースのあり/なしで別単語と認識される。
- 有料検索(Yahoo!プロモーション/Googleアドワーズ)では、同一読みの場合に限り漢字・ひらがな・カタカナのどの表記でもBold表記される可能性がある。
- 自然検索(オーガニック)において、タイトル・表示URL・本文(コンテンツテキスト)それぞれでBold表記される条件が異なる。特に、Wikipediaはまた別の条件が適用される。
- 形態素解析の判定は、スペースも考慮される場合がある(スペースあり/なしで別単語と認識される場合に限る)
- 略称も一定条件を満たせば、略称元の検索クエリに対してBold表記される。
- サイトリンクはBold表記の対象外。
- 有料検索(Yahoo!プロモーション/Googleアドワーズ)と自然検索(オーガニック)では、形態素解析が異なる。
- Yahoo!独自のパターン
- Yahoo!独自のコンテンツは検索クエリと完全一致する場合にのみ、Bold表記される。
- Yahoo!マップが表示される場合、検索行為を行ったブラウザの準じたIPがBold表記される。
- Google独自のパターン
- Google検索において、Googleプレイスが自然検索(オーガニック)に表示される場合、特定条件を満たした場合にのみ自然検索(オーガニック)1位に関連するコンテンツテキストがBold表示される。