Google Danceの情報 グーグル ダンス集大成

グーグルダンス・ネクスト



●Google Dance トップ
●Google対策
 ・PageRank
 ・テキストマッチ
 ・サイトテーマ
●検索結果と順位変動
・Googlebot
・Google's Data Centers
・Google Dance Tool
・Googleの検索方法
・Google Toolbar
・Google etc
●実録Google上位表示
 ・ローカル編
 ・メジャー編
 ・サイト編
・SEO検索エンジン最適化
・検索エンジンスパム
 ・スパム実践解説サイト
・リンクサイト

・SEO対策 リンク集
●実況 ・2003/05(カウントダウン グーグルダンス・ ネクスト) ・2003/06(カウントダウン2 グーグルダンス・ネクスト2
下記表中の右、D=Deepbot(IP:216.239.46.x)、F=Freshbot(IP:64.68.82.x)、G=その他のGooglebot(今のところIP:64.68.80.x)。GとFはおそらくフレッシュクロールで、日付入りキャッシュとして表示されるようです。またDの巡回はかなり重要です。次回の月一更新用のインデクシングを行ない、またリンク構造(被リンク情報)やPageRankの計算などに用いられるようです。くわしくはGooglebot一覧

Google Dance Next (グーグルダンス・ネクスト) G F D
2003/05/17 Google Dance、開始。      
2003/05/18 複数のデータセンターが同一内容で更新中。      
2003/05/19 33と53を除いて、すべて更新。      
2003/05/20 53変化なし、その他不自然な変化。    
2003/05/21 53変化なし、その他不自然な変化。PageRankに不審。Googleディレクトリもおかしい。  
2003/05/22 Google Dance、終了。  
▼こんなはずは無い!という記念に(2003/05/22 16:50)
Google Danceサイト、PageRank0の屈辱!
2003/05/23 今回のGoogleの月一更新に関するこのサイトの結論としては、Googleのアルゴリズムに変更があったにせよ、騒がれるほどの大幅ななものとは認められないこと、インデックスのデータベースが更新されたものの、PageRankやリンクポピュラリティなどは更新どころか前々回(3/6開始)のものに更新された、と判断します。  
2003/05/24 2003/03/04開設の@police、PageRank0を確認。しかも「link:www.cyberpolice.go.jp」もなし。このサイトにペナルティを科すって?ますます、「PageRank・リンクポピュラリティの逆更新・仮説」を確信。    
2003/05/25 何と、観測キーワードのほとんどすべてが、今回の更新前の順位よりも上位表示されています。PageRankは相変わらずですが、とりあえず、めでたしめでたし、チャンチャン。  
と思ったら、5/23分のフレッシュクロールが出たりして、順位もやや変動。でも問題ないですね。
15:30現在、データセンターの内容が二つの系統に分かれていますね。フレッシュクロールを表示しているものと、そうでないものと。ちなみにPowered by Googleはフレッシュなしの53を参照しているようです。現在のYahooページ検索結果は、今回のグーグル月一更新が夢幻のごとくです。でもGoogleディレクトリはおかしいまま。
データセンターが統一されています。ところで、時々フレッシュクロールによる日付入りキャッシュが乱入していますが、これも全サーバーが一挙にということでありませんので、少しだけダンスしますね。
2003/05/26 何気にGooglebotの取得するファイルを見ていたところ、今回の更新以降に限ってですが、不思議なパターンを発見しました。Gはネガティブクロールとでも呼べるような巡回をしています。robots.txtを見てはいるのですが、かつて取得したURL情報などから、今はリンクされていないファイルを狙ってGETしています。あとはCGIなどの動的ファイルですね。逆にFの方は、まずrobots.txtを見て、サイトトップやディレクトリなどをGETし、そこからリンクをたどっていくようなパターンですね。まぁ自サイトのみの観測データですから、資料不足なんですが… 情報をお寄せください。  
Domz、Googleディレクトリ、相変わらず乱れています。
2003/05/27 午前中は変わりなしですね。フレッシュクロールがチラホラ。  
海外、というかUSAでも大騒ぎになっていますね。トップページがインデックスから消された、PageRankが0になった、Algoが変更になった、などなど。中にはアンカーテキストにキーワードを埋め込みすぎでセミペナルティを科せられた、との仮説も出されています。でもフォーラムのベテランメンバーにやんわりたしなめられているような…
つくづく思うのは、Googleは外国の、アメリカの検索エンジンなんですねぇ。
Gはディープクロールのための先遣隊かも。ふと思いました。
2003/05/28 Freshbotが来ています。しかも大量にファイルをGET。おまけにGも来ました。  
Everfluxやフレッシュクロールの実態について、USAサイトを検索しているのですが、これに比べると日本国内の情報は非常に少ないですね。特にSEO業者には、クライアントだけでなく、サイト訪問者への情報提供も頑張って欲しいですね。

そろそろDeepbotがやって来る時期が近づいています。準備はよろしいですか、皆さん。

2003/05/29 う〜ん、Googlebotが活動していません。不気味です。    
といってるところ、Freshbotがやって来て、ちょこっとファイルをGETして帰りました。
結局、ある特定のディレクトリを中心に、ファイルをゴッソリとtake outしました。
2003/05/30 01:45現在。をを、今日はじめてこのサイトのトップページのキャッシュを見ました。実は、googleという名前のindex.htmlは今までキャッシュ表示されなかったのです。何らかの理由があって今までそうだったのでしょうが、今日から(昨日から?)このキャッシュが見えるということは、キャッシュシステムに変更を加えたということです。吉と出るか凶と出るか…    
Freshbotが来たものの、ちょこっとファイルをつまんだだけ。
これといって話題がないので、ちょっとお遊びです。
今回のGoogleの不審な更新について、スパムフィルタの導入などが噂されていますし、当サイトも何らかのアルゴリズムの変更はあった(だろう)という立場をとっています。
そこで、次の更新にそなえてスパムサイトを探しているのですが、なかなか「いいもの」があまり見つかりません。情報がありましたら、DMでもお願いできますか。
さて、htmlなどのソースなので、無駄と知りつつ、隠し文字ページを検索してみました。
Google 検索: color=FFFFFF color=white
このSERP(検索結果)で、あるページのキャッシュに不思議な現象を発見しました。そこで、確信をさらに深めるために…
Google 検索: color=red color=blue color=green <H1> font size=
タイトルにタグを入れるとはなんて愚かな、という話はおいといて、何と!「これらのキーワードは、このページにむけて張られているリンクに含まれています:」とキャッシュに表示されるではありませんか。
最初は、リンク元でアンカーテキストをさらに強調して、そのタグ情報までくっついてきたのかなと思いましたが、そうであるならば、上位表示されるのはマイナーなサイトではなく(失礼)、Yahooとかになるはずですから…
2003/05/31 Freshbotが適当にファイルをお持ち帰り。    
時々、観測キーワードで検索していますが、複数のデータセンターで違う検索結果が出る場合があります。これをグーグルダンスのはじまりか、と勘違いしかねません。
最近はフレッシュクロールによって、日付入りやEverfluxや、順位の微変動が頻繁に起こっています。タイミングによっては、しかも全サーバーで同じ検索結果にならない場合があります。現に日付入りが表示されるサーバー、されないサーバーが出てくる時があります。
最近はグーグルダンスのアンテナとして、「link:www.yahoo.co.jp」をwww2.google.comで検索しています。現在のところ総数66,000件です。
要するに、フレッシュクロールによる順位微変動がある以上、月一更新時に確定するバックリンクやPageRankを対象にするべきです。自サイトのバックリンク数なども定点観測に使えそうですね。
2003/06/01 Freshbot巡回。    
2003/06/02 昨夜から日付をまたいでFreshbotが大挙来襲。しまった、未使用ディレクトリをrobots.txtで巡回阻止することを忘れていました。    
Freshbotは毎日のように来ていますが、他のGooglebotの訪問が途絶えています。不気味です。もし今回のGoogle Updateが大掛かりなものだったとするならば、Googlebot全体の役割や働きなども変更されているのかもしれません。
2003/06/03 今日は全くGooglebotが来ていません。厭な予感がしますね。      
少しSERPも動いています。日付入りキャッシュのパターン(当サイトネーミング:フレッシュポジション)も研究しなければ…
ところで、ヒマだったので、というかヒマはないんですが、Googleのアルゴリズム変更やスパムフィルタ導入のアンテナとして、自らスパムサイトを立ち上げました。まず全ページがインデクシングされて、ペナルティが科せられキャッシュが消えたら大成功ですね。本体ミラー
2003/06/04 Freshbot来ました。    
Freshbotが朝から晩まで、しかも巡回パターンが少し違っています。取得しないはずのpdfにアクセス、またリンクもなく、かつてGETされたことのないファイルまで。これって、リンクをたどるのではなく、サイト内を好き勝手に探し回っているってことですね。
2003/06/05 Freshbot、robots.txtほか。    
なにやら、PageRankの表示がおかしいようです。あちこちでも騒がれていますね。でも英語版と日本語版でも違っているみたいです。
ほんとに、Gが巡回してきません。検索エンジン備忘録(Googlebotのクローラ別 巡回データ)の方もご無沙汰のようで。やはりGoogleに何か起こっていますね…
2003/06/06 07:00現在、巡回なしです。    
昼時にFreshbot来ましたね。
最近日付入りが出ません。そして古いキャッシュが表示されて、順位はEverflux。Googleは変化しています(と思います)。
2003/06/07 Freshbot来ています。次から次とGETしています。    
スパムサイトもいくつか巡回してしますね!楽しみです。
さて、通常のパターンでは、Google Dance終了後Deepbotが次の更新用のインデックスを取得し、これがバックリンクやPageRankの元となるのですが、ディープクロールがなかなかされません。やはり今のGoogleはおかしいです。
2003/06/08 Freshbot巡回。    
Deepbotの巡回が遅れていますが、ひょっとするとディープクロールのパターンを変更しようとしているかもしれません。苦手な動的ファイルの取得範囲を広げるとか、スパム判定のためにタグ解析を複雑化しているとか…
2003/06/09 相変わらずDeepbotの巡回もなく、Freshbotだけグルグルと…    
2003/06/10 Freshbot巡回。    
最近、スパムフィルタ確認のために、自分でサイトを立ち上げ、スパムページを収集していますが、逆に上位表示の仕組みもより明確になった来ました。引き続きスパム情報をお願いしますね。
2003/06/11 Freshbot大量ページGET。  
をを、久方ぶりにG(64.68.84.x、64.68.85.x)が巡回、しかも実に大量の、サイトのほとんどのファイルをGET。これはこれで不気味です。
2003/06/12 Freshbot巡回、かなりのファイルをGET。    
2003/06/13 07:00現在、Googlebot来ていません。    
日本時間の昼前から夕方にかけて、Freshbotの巡回。予想に反してpdfもGET。ホントおかしいです。
2003/06/14 Freshbot巡回。まだまだディープクロールなしですね。    

今回のGoogleの「5月革命」以来、フレッシュクロールで同じファイル何度もテイクアウトしているのですが、表示されるキャッシュは古く、しかも新しく作成したファイルはキャッシュすらされていません。何のために、うろちょろしてるんだか…

ほんとうは、こちらの上位表示方法論が正しいかどうかを確認するために、次の更新までファイルをいじらない積もりでしたが、我慢し切れませんでした。スパムページの研究や自らのスパムサイト立ち上げでかなり上位表示の学習ができました。Google最適化とデザインの両立を目指して、このサイトを修正しました。方向性はテーブル頼りのレイアウトの改善とCSSの活用です。以前と見た目はほとんど変わりませんが、複雑なタグをダイエットさせ、ファイルサイズを減らしました。
2003/06/15 Freshbot巡回。ず〜っとGETだぜ。でも待ち遠しいDeepbotは来てくれません。    
久しぶりにフレッシュクロールの定番、日付入りキャッシュが見られましたね。
今回の更新以降、数日おきにキーワードのSERP(検索結果)が変わっています。PageRankやバックリンクが加味されないため、もっぱらページ内のキーワード処理=テキストマッチだけで上位下位となっているんでしょうが…
Freshbotは新しいページにもアクセスしているのですが、それはキャッシュされていません。困ったことですね。実際、5月のはじめからの分が対象外になっているので、ビジネスサイトは打撃が大きそうです。
2003/06/16 待望のGoogle更新開始か!?www2.google.comは216.239.41.100を参照しています。しかもlink:www.yahoo.co.jpの数が変わっています。41のすべてのサーバーが変更。なお都合によって8時まで情報を提供できません。この大事なときに…(BBSでタイガーさんから情報提供がありました)    
続きは、グーグルダンス・カウントダウン2で。
  G F D


Google Dance グーグル ダンス SEO対策     株式会社アルゴリズム運営のSEO塾