☆引用記事:Google、把握するURLが1兆ページ突破と報告 (ITmedia)
米Googleは7月25日、同社が把握するWeb上のURL数が1兆ページを超えたことを、公式ブログで明らかにした。
同社によると、1998年に初めてインデックスを作成した時点で既に2600万ページ存在していたが、2000年に10億ページを突破。このほどついに1兆ページに達した。
Googleはページを数える方法として、まず頻繁に利用されるページを起点として定め、そこから新たなページへのリンクをたどっていくとしている。そのリンク先からまったく同じコンテンツを含むURLや、自動生成されたコピーを省いた残りが今回発表した1兆ページであり、現在1日に数十億ページが新たに生成されているという。
1兆ページの多くは内容が似通っているかWebカレンダーの自動生成コンテンツなどで、あまり検索の役には立たないため、Googleはすべてのページをインデックス化している訳ではない。しかしどの検索エンジンよりも包括的なインデックスを持っているとし、目標は世界中のデータをインデックス化することだという。
Googleが把握するWeb上のURL数が「1兆ページ」を超えたと言われても、すぐにはピンときませんね(^_^;)
ただ、検索の役には立たないものが多いため、Googleはすべてのページをインデックス化している訳ではないという。
確かにそういうページは、検索する側にたってみれば、インデックスされないほうが効率的に違いない。
さらに、現在1日に数十億ページが新たに生成されているそうだが、今後もこのような感じで、無限にURL数が増えていくことになるだろう。
また、そうなればなるほど、検索エンジンの必要性は高まると思われる。
Googleへの期待は高まるばかりだが、Googleの独り勝ちというのもつまらない。Yahoo!やmsnなど、他の検索エンジンには、もっともっと頑張ってほしいものだと思います。



