Google は Web サイトをクローリングしているだけではない。ソースコードも見ているのだ。Google のオープンソース プログラム担当マネージャを務める Chris DiBona 氏は23日、カリフォルニア州サンノゼで開催中の『
OSCON 2009』(7月20日-24日) における基調講演を、このような言葉で始めた。
『Google Labs』のサイトで『
Google Code Search』が利用できるようになってからしばらく経つ。DiBona 氏はオープンソースの現状について、おそらくは予想外の知られざる事実を明らかにした。
DiBona 氏によると、Google はコード検索のためのクローリングによって、重複するものを除く3000万のファイルを確認しており、その中には約25億行に及ぶオープンソース コードが含まれているという。その後、同氏は聴衆に Google の発見に関する質問をして、ちょっとしたクイズを楽しんだ。
たとえば、「オープンソース プログラムは、『C』と『C++』のどちらで書かれたものが多い?」といったような質問だ。答えは C 言語ベースのプログラムで、C++ の倍以上あるという。
『Perl』と『PHP』ではどうだろう? PHP で書かれたものの方が、コードの量にして3700万行以上多かった。
『Smalltalk』対『Objective-C』では? Smalltalk がほぼ3倍のコード量で勝利している。
『Troff』と『Ruby』はどうか? コードの量で8800万行以上の差を付け、Troff の勝ちだ。
プロジェクト重複などの要因により、これらの数字にはおそらくある程度の誤差があることを DiBona 氏は認めたが、「量の多さで埋め合わせをしますよ」と冗談でかわした。
(
David Needle 
)