japan.internet.comThe Internet & IT Network
Twitter
RSS
  • ニュース
  • コラム
  • リサーチ
  • ヘッドライン
  • 特集
  • ブログ
  • プレスリリース
  • 専門チャンネル
  • イベント
  • ランキング
2010年2月10日
文字サイズ文字サイズ小文字サイズ中文字サイズ大
あなたが最も利用しているのはどれですか?
SNS
Blog
Twitter
掲示板
投票締切 2/15 12:00
Webテクノロジー2008年6月20日 15:20

Google の巨大テーブル

国内国内internet.com発の記事
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • Buzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
“どうして商用のデータベースを使わないのですか?”

「商用のデータベースが想定している規模より大きすぎるからですね」
「仮に何とかしてその規模を実現できたとしても、コストが高くなりすぎます」
「データベースよりもっと下の層のチューニングができれば大幅に性能というのは改善できるのですが、商用のデータベースが上にいたら簡単にはできません」

「もちろん、そんなものを作るのが楽しいというのもありますよ」

“それで、それはどれ位大きいのでしょうか?”

「一番大きいものだと、6,000TB で、数千台のマシンにまたがっています」
楽しそうにプレゼンを進めるのは、5月28日と29日、サンフランシスコの Moscone West で行われた「GoogleI/O」(Google の技術者カンファレンス)のセッションに登場した、Google のフェローである Jeff Dean 氏だ。

これは、Google が独自に開発した、「BigTable」と呼ばれる、システムに関する Q&A 部分なのだが、1つのテーブルで 6,000TB、6百万ギガバイトにもなるというのだ。

もう少し馴染みのあるようなテーブル、例えばカラムが20個あるテーブルなら何行になるだろうか?

1つのカラムに平均10文字入っているとすると、1文字2バイトで換算すると1行あたり平均200バイトになる。

6,000,000,000,000,000 / 200 = 30,000,000,000,000行

見るだけでも恐ろしいが、300億行だ。

このような途方もない巨大システムの舞台裏を、Jeff 氏は楽しそうに紹介したのだった。

この舞台裏にはあるのは、巨大で高価なサーバーではない。ラックというサーバーの棚に、安価なサーバーがこれ以上ないというほど目一杯詰め込まれ、フロアに並ぶ、見渡す限りのラックだ。

サーバーの数は、なんと数十万台規模だと推定されている。

「サーバーは、通常3年間使用可能」
「もし1万台のサーバーを持っていたら、一日に10台が寿命による入れ替えとなる」

ということは、数十万台サーバーを運用していたら、毎日数百台を入れ替える計算になる。

ますます途方もない話だ。

これらを人手に頼って管理していたら、大変なことになるのは想像に難くない。そこでこれらのインフラは、自律的に稼動するように高度な管理ソフトウェア(分散ファイルシステム)で制御されている。

そしてその上に、BigTable などの革新的なソフトウェアが乗っているのだ。

BigTable は、名前を聞くとテーブルのようだが、むしろスプレッドシート(もしくはハッシュテーブル)に近いものだ。

例えばカラムの数は可変で、カラムにグループをつけられるし、行にキーがついていたりする。

いわゆるデータベースというと事前に構造を定義しなければならない。つまり、定義してあるから取り出せるというわけだ。

一方 Google が提供するような検索エンジンは全く性質が異なる。事前にとってくる Web ページなどの情報はどんなものか定義できないので、とにかくシンプルに格納しておいて、柔軟に探して取り出せるようにするものだ。

そしてこの BigTable もそういうコンセプトに基づいている。

さて、この BigTable のコンセプトを忠実に実装しているようなプロジェクト(HyperTable)が存在するので、よく知っているデータベースの MySQL と性能などを比較してみたい。

次回はその詳細と結果を報告するので、お楽しみに。

 
記事提供:db4objects

関連テーマ
  • プリンター用
  • 記事を転送
  • Post to Twitter
  • Post to Facebook
  • このエントリーを含むはてなブックマーク
  • この記事をクリップ!
  • BuzzurlにブックマークBuzzurlにブックマーク
  • Yahoo!ブックマークに登録
  • newsing it!
  • この記事をokyuuへインポート
最新トップニュース
  • 株式会社 KOUZIRO は2010年2月9日、1月に発表した BTO 対応ミニノート「UX シリーズ」のカスタマイズメニューを増強し、2月10日から新たな BTO メニューでの販売を開始する、と発表した。
  • Yahoo! JAPAN は昨年秋(2009年10月8日)、CEATEC JAPAN 2009 において「Yahoo! Everywhere 構想」と題した講演を行い、米 Yahoo! が昨年1月(2009年1月7日)に発表、昨年春よりサービスを開始している「TV Widgets」を、日本国内向けにも開発中であることを発表しました。今回は、この「TV Widgets」についてご紹介いたします。
  • 育成すべき社員は「能力」ではなく「価値観」で選んではいかがでしょうか? これは採用でも同様です。
  • リンクとは、サイト間の支持票?(Webビジネス 2月10日 10:00)
    電通の調査によると、マスコミ4媒体における日本の年間広告費は前年度比7.6%減となり、4年連続でのマイナス成長という結果になった。一方で、当社発表の2009年における SEO 市場規模は2008年の130億1,000万円から、163億5,000万円にプラス成長した。
  • SNS や ブログ、YouTube など、消費者参加型のサービスやコンテンツは、いつしか“ソーシャルメディア”と呼ばれるようになった。そして、そのソーシャルメディアを活用したマーケティング手法が「ソーシャルメディアマーケティング」とされている。
【次回予告】 2010年3月9日(火) >>詳細はこちら
第6回 インターネットコム・マーケティングセミナー
進化するモバイルマーケティング 〜最新手法と必要性〜
2009年12月16日(水)開催 10周年記念セミナー
報告レポートはこちら
データメーション
【データメーション】
非常に危険な中国人ハッカー(2月5日)
検索エンジンマーケティング
検索エンジンマーケティング
リンクとは、サイト間の支持票?(2月10日)
「IT の耳」
「IT の耳」
【書評】ソーシャルメディアマーケティング(2月10日)
人が育つすごいしかけ
人が育つすごいしかけ
育成すべき社員は「能力」ではなく「○○○」で選ぶ?(2月10日)
e-Japan 先端テクノロジー解説
e-Japan 先端テクノロジー解説
自治体クラウド開発実証事業の成功要件を検討する(2月10日)
百式のネットビジネス研究
百式のネットビジネス研究
iPhone アプリ制作会社が一覧できる「They Make Apps」(2月9日)
CodeGuru
CodeGuru
C#におけるNull Objectパターン(2月9日)
エンジニア転職ノウハウ開発室
エンジニア転職ノウハウ開発室
日本を元気に!“位置ゲー”のコロプラが止まらない(2月9日)
アイレップの SEM フロンティア
アイレップの SEM フロンティア
あなたのサイトの体調管理は万全ですか?(2月9日)
ソフトウェア研究最前線
ソフトウェア研究最前線
ソフトウェア開発におけるインタラクションデザイン(2)(2月8日)
生活者の力をマーケティングに活かそう
生活者の力をマーケティングに活かそう
顧客にラブレターを書くために必要なこと(2月8日)
Copyright 2010 internet.com K.K. (Japan) All Rights Reserved.