グーグルの2007年内部文書レビュー第三回:スパム定義の詳細

グーグルの2007年内部文書レビュー第三回:スパム定義の詳細

前回の記事の続きです。

この記事では、GoogleのQuality Raterむけ文書のなかで、どんなサイト(ページ)をスパムと判断しろと言っているのかを見ていきたいと思います。

文書の中にあったもので、以下にあげる5つは一般的に知られえいるものだともいますので、まず簡単に箇条書きにします。

1. Jaba ScriptでのURL転送 (検索エンジンに引っかかるサイトとはまったく別の販売サイトなどに転送される場合です。)

2. 期限切ドメイン (他人が所有していたドメインを買い取り、まったく別のサイトを運営する方法です。大抵すでにある被リンクの効果で高評価を受けているドメインです。ここにまったく別のサイトをつくり、そこからの発リンクを有料で販売したりします。)

3. キーワードの詰め込み (これは説明不要ですね。完全にダメです。)

4.フレームを利用したサイト偽装 (これはHTMLのフレームを利用して、検索エンジンロボットが読むサイト情報と実際に訪問者が見るサイトの内容が異なるしかけになっているサイトです。)

5. 隠しテキスト、隠しリンク (白のバックグラウンドに白の文字など。これも明らかにスパム行為ですね。)

以上5つは明らかに、検索エンジンや訪問者を騙しているテクニックですね。こういうテクニックは一時的に効果はありますが、すぐに検索エンジンサイドでスパム認定されてしまうということが良くわかります。これからも、新たなテクニックが出てくるでしょうが、結局このような小手先のテクニックはスパム扱いされるということです。

さて、以上のような小手先の騙しテクニックを使っているサイトは当然スパムなんですが、
この文書はPPC広告サイト、アフィリエイト目的サイトのスパムの可能性についてもかなり詳しく書かれています。

この文書によれば、PPC広告、アフィリエイトリンクのみで、独自コンテンツ(付加価値)のないものは全てスパム扱いとなるようです。(P32) 当然、コピペコンテンツはアウトです。また、PPC広告を検索結果に見せかけたサイトをよく見かけますが、これもスパムとなると書いてあります。(P33)

では、どういうサイトは独自コンテンツ、もしくは付加価値があると判断されるのか?
気になるところです。

それもちゃんと書いてありました。

以下の6項目です。(P32)

1. “Price comparison functionality: Even though the user has to go to another site via the affiliate link to place an order, there is value to have price comparisons right there on the page.”
直訳 「価格比較の機能:仮に訪問者が商品購入のためにアフィリエイトリンクを通らなければならないとしても、価格比較事態が付加価値として認められる。」

これはアフィリエイターにとっては勇気の出る記述ですね。

2. “Product reviews: Pages that provide original reviews offer added value.”
直訳 「商品レビュー: 独自の商品レビューは付加価値のあるコンテンツである。」

価格比較サイトにつづいて、レビューサイトもOKということですね。ただしあくまでもオリジナルのレビューと明記されています。他サイトのレビューのコピペは当然だめ。商品販売サイトの文言のコピペもダメですね。

3. “Recipes: Pages that provide recipes offer added value.”
直訳 「 レシピ:レシピの書かれたサイトは付加価値のあるコンテンツである。」

4. “Contact information: Pages that provide contact information, especially physical addresses and phone numbers, offer added value.”
直訳 「連絡先の情報: 連絡先の記載があるサイト、特に、現住所や電話番号があるサイトは付加価値のあるサイトである。」

たとえメールフォームだったとしても、サイト運営者に質問したりできるので、それは付加価値とみなされるでしょう。

5. “Coupon, discount, and promotion codes: Affiliate pages that provide coupon, promotion, or discount codes for the consumer offer added value.”
直訳 「クーポン、割引、プロモーションコード: 訪問者にクーポンやプロモーション、割引などの特典をつけているアフィリエイトサイトは付加価値のあるサイトである。」

これもアフィリエイターは参考にできますね。

6. “Lyrics and quotes: Pages that display lyrics or quotes offer added value.”
直訳 「歌詞や引用文: 歌詞や引用文を掲載しているサイトは付加価値のあるコンテンツである。」
引用文は出典を明らかにしていれば問題ないのは当然ですが、歌詞はいいのか?著作権は?

これについては34ページ目にさらに詳しい記述がありました。

“Lyrics, poems, ringtones (that the user programs rather than downloads), quotes, and proverbs have no central authority. When you see pages with this content, you cannot judge it to have been copied, and the pages should not be assigned a Spam label.”
直訳 「歌詞、詩、着メロ(ダウンロードするというよりはユーザーが作成するもの)、引用、格言は出典が限定できない。なので、これらのコンテンツを持つウェブページを見かけても、それがコピーされたと判断することは出来ないし、こういったページをスパムと断定することも出来ない。」

これは、どう考えてもおかしいですよね。よほど、古い歌詞や格言などは著作権はもうないでしょうけども、現代の歌の歌詞や、詩はかならず著作者が特定できて著作権があります。仮にネット上に出典がないとしても、歌詞をアップしただけのサイトは本当に許されるのでしょうか?

このことについて、SEO book.com に面白い見解が掲載されていました。

 ”Because Google has not partnered up with the record labels to create a Google database of lyrics somehow those copyright violations are deemed acceptible even if they would have been judged as spam under Google’s typical guidelines. And, of course, after Google creates a relationship to get those lyrics hosted on Google.com, many of those lyrics sites will indeed be deemed as spammers.” (文末リンク参照)
直訳: 「GoogleはGoogle独自の歌詞データーベースを作成するための契約をまだ各レコード会社と結べていない。なので、本来スパムと判断されるべき、このような著作権法違反行為も許容範囲とするしかないのである。そして、もちろん、Googleがレコード会社と契約を交わし、独自の歌詞データベースの作成が可能になったときは、現存する歌詞サイトはスパム扱いとなるのである。」

つまり、現在はグーグル自身が歌詞サイトを運営していないので、現存する歌詞サイトをスパムとして検索結果からはじいてしまうと、グーグルのコンテンツが減り、利用者が減るので今は出来ないという説明です。

深い読みです。

しかし、仮に、グーグルがスパムと判定しなくても、レコード会社は著作権違反で歌詞供給サイトを訴えることは出来るので、このようなサイトを運営するのは、危険なことに変わりはありません。

さて、今回の記事では、Googleのスパム判定の基準をいろいろと見てみました。

他にもこまごまといろいろ書いてありましたが、要点は大体以上のとおりです。

最後に、このGoogle文書の文末に、「スパム判定に迷ったらこうせよ!」という記述があったので、
それで、シメさせて頂きたいと思います。

きっと、PPCサイト、アフィリエイトサイトを作成する際の良い指針となることでしょう。

“When trying to decide if a page is Spam, it is helpful to ask yourself this question: If I remove the scraped (copied) content, the ads, and the links to other pages, is there anything of value left? If the answer is no, the page is probably Spam.”
直訳:「 あるウェブページがスパムであるかそうで無いのか判断をするさいには、以下の質問を自分にしてみると良い。『もし、このページから、コピペコンテンツと、広告と、その他アフィリエイトリンクを取り除いたら、何か価値のある情報は残るだろうか?』 その答えが『ノー』であるならば、そのページはきっとスパムであろう。」

参考資料
1. 「General Guidelines Version2.1 (April 6, 2007)」(作者不明、一般的にグーグルの内部閲覧用文書と認識され ” “Google Spam Recognition Guide for Quality Rater” と呼ばれている文書で、2008年3月中旬、beu blog にて紹介されその後インターネット上に出回る。2008/3/17 現在、beu blog でのこの文書のダウンロードリンクは削除されている。)
2. Spying on Google: What is Spam? What is Relevant? Read This to Find Out (SEO Book.com Blog、2008/03/11)

この記事をつぶやく! (*゚▽゚)ノ”

Posted 2008-03-18 (Tue) 13:16  Updated 2008-12-08 (Mon) 5:49
Category: Google 内部文書レビュー   Tag: , , ,

Comments

  1. anishio says:

    JAVAやMETAでのゼロタイム転送などがスパムとなる場合、PHPなどで、フォーム送信処理と同じようにURLの生成処理をしてページジャンプした場合はどうなるのでしょう?
    事によってはウチのサイトってヤバいのかもしれませんね。

  2. sugane says:

    スパムと判断されるのは、まったく別のドメインのURLへ飛ばされる場合ですが、Compaq → HP のように系列企業の場合などはスパムにならないという例が書いてありました。

    もちろん、同一ドメイン内も問題なしです。

    この文書を見る限りでは、Quality RaterはURL転送の動機が不順かそうでないか、というところまで見ているようですので、URL転送を全て自動的にスパム扱いすることは無いみたいです。

  3. anishio says:

    生成して飛ばしているのはアフィリエイトなので、同一ドメインではないんです。

    元々リンクシェアの配布タグがXHTML基準ではないので(かといって改造も不可)苦肉の策でステータスを持たせて一度サーバー内でPHPが移動先を生成し、ヘッダーで飛ばすようにロジックを組みました。

    あくまでサーバー内での処理であって、別のページが表示されてゼロタイムでジャンプしているわけではない上にユーザーの意思に関係なく飛ばすわけでもないので、現状は問題ないと判断していましたが…怪しくなってきました^^;

    とりあえず今はGoogleなどでペナルティをもらっている様子もないので、少し様子を見てみます。これでペナルティになるようなら別のロジックを組みなおすしかないですね。

  4. sugane says:

    Google文書にはリディレクトの種類までは書かれていないので判断しかねますが、Googleはこの辺はあくまで目視でスパム判断しているようなので、anishioさんのサイトの場合はコンテンツがしっかりとありますし、アフィリリンクが広告バナーになっていて、利用者は広告だとわかってクリックするわけですから、SEロボットや訪問者を騙しているわけじゃないですし、ペナルティーはないのではないかと思います。あくまで推測ですが。でもきわどいですね。

    アフィリリンクの転送がどの程度許されるのか、前からぼくも気になっていたんですが、ちょっと調べてみようと思います。

    とりあえず、以下のサイトがリダイレクトに関して詳しく書いています。アフィリリンク転送についての記述はないですが、よろしければ参考にしてみてください。
    http://www.ignis.co.jp/memo/http301.html

  5. sugane says:

    ちょっといろいろ見て回りましたが、

    301リダイレクトでのURL転送はGoogleもYSTも推奨で、多くのアフィリエイターが使っていますが、アフィリリンクにURL転送を使った場合に検索エンジン側からのペナルティーがあるかどうかは今のところ、やはり不明です。

    また、URL転送がASPサイドから短縮URLと認識されるかどうか、だとしたら、ASPの規約違反にならないかどうかも該当のASPに確認したほうが良いと思います。事実上黙認しているASPは多いようですが。。。

  6. sugane says:

    海外のサイトをいろいろと見てきましたが、
    .htaccess や PHPでのアフィリエイトリンク転送は、検索エンジンにもそれほど問題視されていないという見解が大勢です。

    ただし一方では、リンク隠しに変りないので「注意が必要」とする意見もありました。

    また、.htaccess や PHP でのアフィリエイトリンク転送をOKとするサイトでも、robots.txt ファイルで検索エンジンロボットをブロックし、転送用URLを検索エンジンにインデックスされるのを防ぐことを薦めています。

    万が一転送用URLがインデックスされてしまうと、検索結果からそのリンクをクリックした人は、まったく別のサイトへ飛ばされるわけで、検索エンジンロボットと利用者を騙すことになるからです。これは完全にURLリダイレクトのスパム扱いになるということです。(自サイト内で転送用URLをクリックさせる場合とは事情が違ってくるということですね。)

  7. anishio says:

    おはようございます。
    なんだかお手数おかけしてしまったようで、すみません。

    なるほど、スパムの最終判断が人間である以上、アクセシビリティやコンテンツ内容が重視されるわけですね。
    検索エンジンに引っかからないようにするというのは、そのファイルに直接アクセスした場合、該当のステータスをGETに載せていない限り自サイトのTOPページにリンクしますが、それでも念のためやっておいたほうがよさそうですね。

    robots.txt編集しておきます。

  8. sugane says:

    いや、ぼくも気になってたんでちょうど良かったです。^^


Comment Closed




グーグルの2007年内部文書レビュー第二回:スパム定義の概要 »
« グーグルの2007年内部文書を読んだ感想など