Google Danceの情報 グーグル ダンス集大成

グーグルダンス・カウントダウン



●Google Dance トップ
●Google対策
 ・PageRank
 ・テキストマッチ
 ・サイトテーマ
●検索結果と順位変動
・Googlebot
・Google's Data Centers
・Google Dance Tool
・Googleの検索方法
・Google Toolbar
・Google etc
●実録Google上位表示
 ・ローカル編
 ・メジャー編
 ・サイト編
・SEO検索エンジン最適化
・検索エンジンスパム
 ・スパム実践解説サイト
・リンクサイト

・SEO対策 リンク集
●実況 ・2003/05(カウントダウン グーグルダンス・ ネクスト) ・2003/06(カウントダウン2 グーグルダンス・ネクスト2
Google Dance Count Down (グーグルダンス・カウントダウン)
2003/05/02 216.239.35.xxでおかしな変更がはじまりました。
2003/05/05 Freshbotが「robots.txt」とディレクトリを2〜3取得。いい兆候かな。なお、Deepbotの最終ページ取得は4月27日でした。
2003/05/06 終日Googlebot巡回なし。Googlebotのパターンから、もうすぐGoogle Danceがスタートするでしょう。
2003/05/07 あちこちで物議をかもしている「www-sj.google.com(216.239.35.100)」ですが、この35がそのまま他のデータセンターのプロトタイプになるとは思えませんが、ひょっとすると大波乱の月度更新になるかもしれません。
2003/05/08 Googlebotがきています。IP64.68.80.xです。
2003/05/09 今日もGooglebotが…
2003/05/10 今日は、正規のFreshbotが大挙来襲!
よく見ると、64.68.82.xCrawlerx64.68.80.xCrawlxとは、取得するディレクトリが違っています。
通常は、Google Danceスタートの合図としてwww2.google.comやwww3.google.comの変化が挙げられています。ところが現在は、これらに「216.239.35.100」が割り当てられていて、かつこの「35」が途轍もなくおかしいと騒がれています。
このサイトでは、Googlebotの巡回停止がGoogle Danceのスタートの条件の一つであると判定しています。よってまだグーグルダンスは、はじまっていないことになります。
2003/05/11 ま〜た64.68.80.xのGooglebotが巡回…
2003/05/12 昨日夜半(22:24)から本日未明(00:17)にかけて、Freshbot大挙来襲。やはりFreshbotは特定のディレクトリのファイルのみGET。
2003/05/13 ま〜たまた64.68.80.xのGooglebotが巡回… おぉFreshbotまでもが、それもぎょ〜さん!
2003/05/14 相変わらず来てますね、64.68.80.x
2003/05/15 まだまだ来てます、64.68.80.x。 このパターンだと月一更新は来週に持ち越しですね。ということは、従来どおりの月末更新に戻るのかな?
▼2003/05/15 20:00現在 変化が見られるデータセンター
216.239.35.98
216.239.35.99
216.239.35.100
216.239.35.101
216.239.35.102
216.239.35.103
216.239.35.104
216.239.35.105
216.239.41.98
216.239.41.99
216.239.41.100
216.239.41.101
216.239.41.102
216.239.41.103
216.239.41.104
216.239.41.105
216.239.57.98
216.239.57.99
216.239.57.100
216.239.57.101
216.239.57.102
216.239.57.103
216.239.57.104
216.239.57.105
35、41、57は内容が微妙に違っています。
35についてはアレコレ言われていますが、41を語っている人は見かけませんね。
おまけに57も変化していますが、ではどれが今回の月一更新のプロトタイプになるかというと…
Goomani(ぐーまに) で、http://bingoall.net/を対象に検索してみました。(2003/05/15 20:30現在)
キーワード www.google.com 216.239.35.100 216.239.41.100 216.239.57.100
アクセスアップ 78(89)/192,000
圏外/154,000 圏外/147,000 57(68)/151,000
Google対策 1/61,200
5(9)/47,600 6(11)/55,500 1/56,100
上位表示 25(42)/12,600
21(35)/10,400 20(34)/12,600 19(32)/12,700
Google 17(26)/535,000
21(30)/386,000 21(30)/456,000 20(29)/451,000
SEO 圏外/57,100
圏外/49,400 圏外/51,000 圏外/51,300
検索エンジン最適化 32(50)/8,890
18(29)/8,430 18(28)/10,100 16(26)/10,300
備後 8(11)/37,700
14(19)/34,100 14(19)/35,200 13(18)/35,100
MS-IME 2(3)/16,700
3(5)/14,700 3(5)/16,500 6(10)/16,600
35(sj)、41(fi)、57(cw)のどれも月一更新のプロトタイプにはなり得ないはず。理由としては、ほとんどキャッシュが表示されず、しかも2〜3ヶ月前のサマリーになっています(57のみフレッシュクロールを反映している部分もありますが…)。私のサイトに限らず、どのページもGoogleディレクトリ掲載を加味していないため、順位に真実味がありません。そして別の理由は、Googlebotの巡回が止まっていないからです。この状況で、どれかのデータセンターを標準にするようなことがあってたまるもんですか!
ぐーまにの作者タカヲ氏のメルマガにあったEverfluxも気になるところです。
2003/05/16 今日も一日中来ています、64.68.80.x
2003/05/17 今日は正規のFreshbotが、ただし9:12でパッタリ… ところで上記の57が元に戻っています。
※ なお5/10のGooglebotの活動停止条件は保留しておきます。参照:検索エンジン備忘録(Googleクローラ(Googlebot)の巡回&更新周期表)
Google Danceのスタートを判定する条件は何か?このサイトのGooglebot活動停止仮説は正しいのか?思い余って、検索エンジン備忘録のzeroさんにDMを。ご好意でログを提供していただき、少し分析してみました。しかし、結論としてGooglebot仮説はどうやらあやふや。今までのグーグルダンス開始と思われる日付あたりで20時間ほどのGooglebot停止期間が見受けられますが、ただそれだけです。また最近はGooglebotの巡回が余りに多く、つまり新しい現象なので、判断しかねるというのが実際です。興味をもたれた方は、ご自分のサーバーログと上記「Google Dance 開始日一覧」を比較検証してみてください。よろしければその分析もお知らせいただければ幸いです。
▼2003/05/17 23:10現在 変化が見られるデータセンター
216.239.35.98
216.239.35.99

216.239.35.100
216.239.35.101
216.239.35.102
216.239.35.103

216.239.35.104
216.239.35.105


216.239.39.100
216.239.39.101
216.239.39.102
216.239.39.103

216.239.41.98
216.239.41.99
216.239.41.100
216.239.41.101
216.239.41.102
216.239.41.103
216.239.41.104
216.239.41.105
216.239.57.98
216.239.57.99
216.239.57.100
216.239.57.101
216.239.57.102
216.239.57.103
216.239.57.104
216.239.57.105
左記の色分けのように、2パターンの系統になっているようです。それ以外のパターンと合わせて3通りです。
しかも、www.google.comは216.239.41.99! www2.google.comは216.239.35.100
2003/05/18 Googlebotの沈黙、複数のデータセンターが同じ内容に更新中。よってGoogleの月一更新がはじまっているもよう!このサイトでは、Google Danceスタートは、日本時間の2003/05/17と判定します。
▼2003/05/18 15:30現在 変化が見られるデータセンター
216.239.35.98
 ↓
216.239.35.105
216.239.39.98
 ↓
216.239.39.105
216.239.57.98
 ↓
216.239.57.105
左記のすべてが、同一内容になっているようです。ただし、キーワード検索結果で表示されたページをクリックしてもPageRankが表示されませんし、Googleディレクトリ掲載が反映されていません。
216.239.37.98
 ↓
216.239.37.105
216.239.41.98
 ↓
216.239.41.105
 
グーグルダンスがはじまったものの、上記サーバーが月一更新の決定版とは判定できません。例えば、「link:yahoo.co.jp」や「related:yahoo.co.jp」などで検索してみると、結果の総数に不審を抱きますね。
※一応このサイトのGoogle Danceスタート、月一更新開始は、Googlebotの活動停止+複数データセンターの変化(同一内容)を条件としてみます。
というものの、他のサーバーが変化しませんねぇ!?
Google Danceの最中は、PageRank(ページランク)もダンスします。詳しくはこちら
2003/05/19 いよいよGoogle Dance(月一更新)も大詰めを迎えているようです。残すは、33と53のみになっていますね(10:20現在)。
ただ今(20:30)、www.google.comは216.239.57.99! www2.google.comは216.239.35.100。33と53は変化なし。
▼2003/05/19 20:45現在、http://bingoall.net/のキーワード検索結果(byぐーまに)
キーワード 216.239.33.101 216.239.35.101 216.239.37.101 216.239.39.101
アクセスアップ 78(89)/180,000 圏外/154,000 圏外/156,000 圏外/162,000
Google対策 1/61,200 5(9)/47,800 6(11)/56,600 6(11)/57,700
上位表示 25(42)/12,600 27(44)/10,400 26(43)/12,700 27(44)/12,800
Google 17(26)/594,000 圏外/385,000 圏外/558,000 圏外/649,000
SEO 圏外/57,100 圏外/49,500 圏外/52,000 圏外/53,500
検索エンジン最適化  32(50)/8,850 31(49)/8,530 29(46)/10,300 30(47)/10,300
link:yahoo.co.jp 圏外/67,200 圏外/85 圏外/85 圏外/85
related:google.com 圏外/30 圏外/31 圏外/31 圏外/31
一応、どれも今回の月一更新の標準とはならないと信じて、後世?のためにここに記録しておきます。ちなみに33は更新前の検索結果ということになります。
2003/05/20 11:40現在、33は、98・99と104・105が更新しています。53は変化なしですね。
Googlebotも巡回してきました。そろそろダンス終了でしょうか。
12:20現在、33のすべてが更新。残すは53のみ。
2003/05/20 16:30現在、未だ53は更新されていませんが、Googleを採用している、Yahoo、Excite、BIGLOBE、@nifty、So-netなどで更新を確認しました。これらが今回の更新内容ということなのでしょうか?
私のサイトのいくつかが、YahooやGoogleのディレクトリに登録されているのにPageRank0です。もう少し変わってきそうな予感はするんですが… 前回も同じような体験をしました。
18:40現在、33・35・37で検索結果が微妙にあるいは大幅に違っていますねぇ。53も相変わらず動きがありませんし、確定までにまだまだ掛かりそうです。
現状の自サイトの検索結果に一喜一憂しない方がよさそうですね。インターネットでは、すばやいレスポンスがビジネスマナーですが、他方では情報が不足していて、不可解な現象ばかりの状況での脊髄反射はやめておくのが賢い選択でしょう。
21:20 現在、何と!53が更新しないまま、33が更新前に戻っています!!そして35も違った内容に。
www.google.com、www.google.co.jpは、それぞれ色々なデータセンターにアクセスして、ダンス・ダンス。なお、現時点ではYahooなどは57と同じ内容と思われます。まだまだ波乱が続きそうです。
PageRankについて、ちょっと不思議な現象を確認しているのですが、当然このPageRankもダンスしています。この値もToolbarがGoogleのデータセンターにアクセスして取得している訳ですが、現時点でToolbarがアクセスしているデータセンターが33と53の場合は前回のPageRank、それ以外のデータセンターの場合は、前々回のPageRankのような気がしています。
PageRankとは、リンクの量と質、リンクポピュラリティなのですが、こういったリンク構造のデータは、更新後あらためて書き換えられるのでは?
2003/05/21 9:25現在、53は更新なし、33は元に戻っていたのが、100〜103がもう一度更新!Powered by Google(Yahooのページ検索など)は57を参照しているもよう。www.google.com、www.google.co.jpはダンス中。
仔細にこだわると、33.100と35.100〜35.103は同じ内容で、他の更新サーバーと違っています。37・57のすべてのサーバーも微妙に違っています。
今回の不審な更新の元凶である35、通常メインとなっている33の揺れ、全く更新しない53。
とにかく、5/7に書いたとおり、大波乱の月一更新になりましたね。
何度も言いますが、現時点での順位の評価や、あまつさえGoogleのアルゴリズム云々を語るのは尚早ですね。何しろ落ち着く先がどこなのか判断付きかねますから…
Googleの月一更新について、ある程度現象がつかめてきました。キーワード検索による順位確認する前に、まず「インデックスファイル(キャッシュ)の入れ替え」を確認すべきでした 。
▼複数のサーバーに対して、こういう検索ですね。
site:ホスト名 ホスト名
link:ホスト名
related:ホスト名
"ホスト名"
キーワード
これで、インデックスされている自サイトのファイルも確認できますし、何で気が付かなかったんだろう…
PageRankのデータベースはまた別物のような気がします。もしやと思って、複数のGoogleディレクトリを見てみると、やはりデータが前月分へ戻っているものがあるではないですか。ここでは登録サイトのPageRankがグラフ表示されています。つまりPageRankと密接に関係している訳です。
まだまだ、更新完了せずですね。
14:40現在、www.google.comは51、www.google.co.jpは53へ。Powered by Googleも53。53ということは更新前の状態ってことです。directory.google.comは33へ。
▼ちょっと息抜きに。ある方からメールをいただいて見付けました。
www.google.ne.jp
IPは「216.239.53.99」となっています。しかもPageRankも… ところでgoogle.ne.jpのIPは「216.239.33.100」です。
22:50現在、53更新なし、35は中途半端、www.google.com、www.google.co.jpは33、Powered by Googleは57。Googleディレクトリは33・51・53は前回分(つまり更新なし)、35・37・39は前々回分(つまり前回更新の前に戻っている)。
2003/05/22 01:30現在、Google追っかけも疲れますわ。予想では、グーグルダンスの宴の後では、それほど劇的変化は見られない、という結論になるのではと思います。
10:00現在、すべてのサーバーが同じインデックスに更新されたようです。最後の砦?の53も陥落しました。しかしキーワード検索の順位、つまり上位表示などについては、もう少しゆれがありそうです。ズバリ、まだ確定していないですね。
理由は、少なくとも私のサイトのすべてでは、PageRankが前回(4/11スタート)更新の前の値に戻っているからです。前回更新から今回更新に掛けて、重大な上位表示要素が加わったサイト・ページは、もう少し待たねばなりません。逆にそれがないサイト・ページも、真の更新確定後に上位に乱入される可能性があります。
とりわけここのサイト、Google Danceは、Googleディレクトリのカテゴリを辿っていくと「World > Japanese > コンピュータ > インターネット > WWW > ホームページ宣伝」に存在していて、PageRankも4を示していますが、Googleディレクトリのトップからタイトルを検索すると出てきません。Dmozにも掲載されていて削除されていませんから、タイトル検索に掛からないといって、今回Googleディレクトリから削除される予定とは考えられません。
おそらく、Googleディレクトリの各カテゴリに掲載されていることと、トップから検索する時のクエリ用のデータベースとは別物になっているのかと。いつくかありそうなGoogleディレクトリのデータベースのどれかとPageRankなどが連動していて、結果としてキーワード検索にも影響をおよぼしていると判断されます。
またまた繰り返しますが、現時点で今回の更新を語ることも、まして被リンク構造云々のGoogleのアルゴリズムがどうのこうのと議論することも慎むべきかと思います。特に作為的と疑わしいSEOに対する敵意ある結論(例えばリンクファームとみなされたなど)は下すことができません。
Google研究、特に上位表示を分析してみるとすぐ分かるのですが、実はGoogleは非常に保守的です。つまり前回から今回に掛けての上位表示対策が、更新中や更新直後では加味されていないということは、逆に前々回までの手当ては織り込み済みで安定していることになります。月一更新にもビクともしません。過去の実績が評価されているのです。新参者には非常に冷たい仕打ちです。そして今回の更新確定後は、また1ヶ月以上もこの順位で待ちぼうけを食らうのです。
11:30現在、www.google.com、www.google.co.jpともに33.99を、www2.google.comは35.100を参照していて、平常のパターンになっています。これで、Googleディレクトリ、PageRank(Googleツールバーを含む)が落ち着いたら、今回の月一更新の完了・確定になると判断されます。
14:00現在、私のところも含めてGoogleディレクトリの最近登録されたサイトのPageRankが、未だ反映されていませんね。
15:30現在、今回の大騒動の張本人35系の100〜103が、少しおかしいです。Googlebotも大襲来しているのですが…
まぁ、明日あたりでGoogleの月一更新も落着でしょうか? 長い人生の間のたった数日のことですがネ。
▼こんなはずは無い!という記念に(2003/05/22 16:50)
Google Danceサイト、PageRank0の屈辱!
▼第二弾(2003/05/22 17:20)
PageRankなし!
こんなはずは無い!というよりも、呆れましたわ!!
20:30現在、Googleディレクトリが荒れています。
ここに列記しているすべてのGoogleディレクトリのトップページのPageRankが0になっています!しかも…
Googleディレクトリ51はPageRankがありましぇん
まだまだ、燻っていますねぇ。なお、このサイトでは、Google Dance終了宣言はまだ出しません。
2003/05/23 とりあえず、Google Dance終了と認めましょう。ただしキーワード検索でおかしいなぁと思しきことは、Googleの大幅なアルゴリズム変更というよりも、なぜだかPageRank情報が前々回に戻っているため、とこのサイトでは判断しております。
16:10現在
GoogleディレクトリのカテゴリがPageRank0!
ほんと、おかしいですよねぇ。
現状のレポートは当サイトのキーワード検索結果、実録Google上位表示サイト編に書いておきます。
今回のGoogleの月一更新に関するこのサイトの結論としては、Googleのアルゴリズムに変更があったにせよ、それが騒がれるほどの大幅ななものとは認められないこと、インデックスのデータベースが更新されたものの、PageRankなどは更新どころか前々回のものに更新された、と判断します。
つまり、GoogleはSEOというよりもスパム排除のための何らかの新しいフィルタを導入した。それは、検索エンジンユーザーの利益に適うはずのものだったが、ついでに、事故か、バグかで、前回分のPageRank・リンクポピュラリティなどを含むデータを破損してしまった。
PageRankなどについては前回(4/11)の更新を「なかったこと」にされただけで、インデックスはまともに蓄えられています。よって、前回の更新後のキーワード検索結果ではなく、それ以前の検索結果順位と比較した時には、それほど大きな違いは見られません。
もちろんその間に施したGoogle対策はある意味で水泡に帰したわけですが、Googleに由々しき一大事が起こったかと騒ぐことはなく、重大な問題ではないと思っております。次の月一更新で多くの問題は解消されるとにらんでいます。


今回の月一更新についての考察〜PageRankの逆更新
スケジュール
1 02/15頃   最終Deepbot巡回 (A)
2 03/06 更新開始  
3 03/21頃   最終Deepbot巡回 (B)
4 04/11 更新開始  
5 04/27頃   最終Deepbot巡回 (C)
6 05/17 更新開始  
前提 Deepbotの巡回によって、月一更新用インデックスのためのファイルをGETする。この時に、リンク構造(被リンク情報)を把握し、PageRankを計算する。
仮説(1) (C)-5のDeepbotは、(C)-6のためのインデクシングを行なったが、リンク構造やPageRank情報などは、(C)時点分が破損。それだけでなく、(B)までもが破損。結果として、リンク構造やPageRank情報は(A)まで、(A)-1まで引き戻された。
仮説(2) インデックスのデータベースには、(C)-5のDeepbot、もしくはそれ以降のFreshbotによってGETされたファイルがキャッシュされているが、(B)-4以降の状況がどうであっても、(A)時点でのリンク構造(被リンク情報)やPageRankが採用される。
仮説(3) また(A)時点で、インデクシングされていないファイルや、リンクポピュラリティが低いファイルは、今回キャッシュなしとなる。
風説(1) 実質、(A)-1までの被リンク情報へ逆戻りするし、リンク元もその時点のPageRankになるため、いきおい被リンク数もかなり減少する。そこでGoogleのアルゴリズムが大きく変更され、「リンクが厳密になった」とかの説が流される。
風説(2) 風説(1)と同じ理由で、「テキストマッチがより重視されるようになった」との説。「タイトルのキーワードの重み付けが強化された」とも。
風説(3)

強烈なものは、悪意や偏見で現象を一瞥して、「Googleが行き過ぎたSEOを駆逐しはじめた」との説が。あるいは、新アルゴリズムとやらの適用が、一律・公平・平等でないため、「ランダムなペナルティはスパムへの警鐘である」とか、訳の分からない講釈がまことしやかに流されている。

結論 このサイトとしては、Googleのアルゴリズム変更はハッキリ把握できない。しかし、複数の管理サイトやある程度把握できるサイトなどを分析した結果、見えるものは、リンク構造(被リンク情報)やPageRankの前々回時点までの逆更新だけである。以上のように判断しています。
 
再検証〜データベース入れ替え
情報 BBSでタイガーさんから、データベース入れ替え説が出されました。
タイガー仮説 タイガーさんの観測データ?によると、1年以上も前からトップ表示だったキーワード羅列ページが大きくランクダウンし、また6ヶ月以上も前からのスパムサイトがインデックス消去されたとのことです。
タイガーさんの仮説では、やはりGoogleは今回の更新でスパムフィルタの新アルゴリズムを導入したのではないか、しかし、データベースは追加は得意だが、特にリンク構造情報などの削除は苦手で、SE的には、データベースの入れ替えに踏み切る、とのことです。
現象(1) ・ToolbarのPageRankが極端に下がったりして、前回更新(4/11)以前に戻った
・前々回更新(3/6)以降にGoogleに認知されたサイト・ファイルが今回更新でキャッシュがなくなっている
・Googleディレクトリの一部のサーバーで、やはり前々回更新以前のデータのものがある。
※よって、リンク構造(被リンク情報)やPageRankが、前々回更新(3/6)時点までへの逆更新したとしか考えられない。
現象(2) ・前々回への逆更新では説明できない、下位表示や削除されたサイト・ページがある。
※スパムサイト・ページに対してペナルティが科せられているとしか考えられない。

ライオン丸仮説

タイガー仮説

1 02/15頃   最終Deepbot巡回 (A)  
2 03/06 更新開始   この段階でのデータベースに対して、スパムフィルタの新アルゴリズムを適用させて、新しいデータベースを構築した
3 03/21頃   最終Deepbot巡回 (B) ※直近データに対するフィルタ適用や、非リンクなどのリンク構造情報の削除も難しく、その手法は採用されなかった
4 04/11 更新開始  
5 04/27頃   最終Deepbot巡回 (C)  
6 05/17 更新開始   新データベースへの入れ替え
ライガー仮説! こう捉えれば、PageRankなどの逆更新と、スパムフィルタ導入との整合性が出てきます。また今回の不審な更新に対して、「何かの間違いでは」、あるいは「トラブル発生」などのネガティブな批判ではなく、Googleは検索エンジンの革新に踏み切ったとポジティブに評価できます。
未検証 ペナルティとなった具体的な対象スパムの内容が抽出できていないので、Googleの新アルゴリズムと物々しく言っても、あくまでも想像の域でしかありません。
またBBSにてGウォッチャーさんが、これまでも同じ体験をしたと書き込んでいます。これがGoogleの新アルゴリズム適用、データベース入れ替えのパターンかもしれませんね。
異論・反論 この「ライガー仮説」に対して、BBSの方へどしどしご意見や情報をお寄せください。
 
次のGoogle Dance、月一更新までのレポートは、Google Dance ネクスト
Googleの検索と順位、Googlebot、更新などの関係は、検索結果と順位変動


Google Dance グーグル ダンス SEO対策     株式会社アルゴリズム運営のSEO塾