ビッグデータ解析の真打ち登場! 研究者が起業したデータブリックス

提供データが氾濫する現代において、その管理と分析が企業経営の生命線になりつつある。その未来を司るのはテック大手ではなく、学術界発の新興企業かもしれない。

2015年11月のある日、米カリフォルニア州サンフランシスコ中心部のビルの13階にある会議室には張り詰めた空気が満ちていた。その日、カリフォルニア大学バークレー校の研究者7人が立ち上げた創業2年目のソフトウェア開発企業「データブリックス」は2つの難題に直面していた。

資金難に直面したデータブリックスは新たな調達を試みたものの、売り上げがほぼゼロの同社に出資する投資家はいなかった。他に選択肢がない。出資元のニュー・エンタープライズ・アソシエーツ(NEA)でパートナーを務めるピート・ソンシーニはそう考え、3000万ドルの緊急出資を申し出た。

次の議題は最高経営責任者(CEO)の選任だった。CEOのイオン・ストイカは、退任して教授に戻ろうとしていた。ふつうの会社であれば経験豊富な新CEO迎えるところだが、取締役会はストイカと同じ研究者上がりのアリ・ゴディシ(42)を選んだ。

「『この判断はまったく理にかなっていない。教授だった創業者の代わりに、また経営の経験がない人物に会社を任せていいのか?』という声もあった」と、同社に初期投資したアンドリーセン・ホロウィッツ(a16z)のベン・ホロウィッツは振り返る。そこで同社は、1年間の「試用期間」を設けてゴディシを起用することに決めた。

ところがゴディシはその後、数百社に及ぶa16zの投資先の中でも屈指のCEOに成長した。今や企業価値が280億ドルに及ぶデータブリックスは、昨年2億7500万ドルの売り上げを記録。今年は5億ドルを超える勢いで、上場も視野に入れている。

ゴディシの魔法のような手腕で、3人のビリオネアが誕生した。ゴディシ、ストイカ、そして最高技術責任者のマテイ・ザハリアだ。彼らの保有資産は14億ドル以上に達している。これだけでも驚くべき偉業だが、さらにすごいのは共同創業者たちの多くが、自分たちの研究に没頭するあまり、会社を立ち上げることに消極的だったという事実だ。

そもそも彼らは、自分たちが開発したソフトウェア「ApacheSpark(アパッチ・スパーク)」を収益化する意思がなく、オープンソースでそれを一般公開していた。「我々はバークレーで暮らすヒッピーの集まりで、ただ世界を変えたかっただけだった」と、ゴディシは振り返る。

データブリックスが提供する最先端のソフトウェアは、人工知能(AI)を用いて、データウェアハウス(分析に使われる構造化されたデータ)とデータレイク(生データを保存する安価な格納庫)を融合させ、「レイクハウス」なるものを構築している。ユーザーがレイクハウスにデータを流し込むと、AIが未来に関する予測を立てるのだ。

例えば、ある農業機械メーカーは、自社のマシンにセンサーを搭載し、エンジンの温度や使用時間を測定している。データブリックスはその生データを用いて、トラクターが故障しやすい時期を予測する。eコマース企業は、ソフトに売り上げを伸ばすためのサイトの改修を提案させ、証券取引所やソーシャルメディア企業は、悪意ある利用者を検知するために用いている。

1984年にイラン・イラク戦争が4年目に入るなか、イランの上流階級に属していたゴディシの一家はスウェーデンに逃れた。5歳だったゴディシにとって、祖国の記憶といえば爆撃とサイレンの音の連続だ。

一家は学生寮を転々としつつ、ストックホルムの怪しげな地区からまた別の怪しげな地区へと引っ越した。ゴディシは絶えず学校を移り、新しい友達を作らねばならなかった。このときの経験のおかげで、人付き合いが得意な今の自分があるとゴディシは語る。彼がエンジニアリングの才能を発揮し始めたのも、幼少の時だった。彼の両親は、中古の「コモドール64」を格安で手に入れてくれた。小学4年生だったゴディシは、独学でプログラミングを学んだ。

ミッドスウェーデン大学でコンピュータ工学と経営管理の修士号を取得した彼は、王立工科大学(KTH)に進み、06年にコンピュータ科学の博士号を取得。30歳だった09年にカリフォルニア大学の客員研究員として渡米し、そこでシリコンバレーを垣間見た。当時、フェイスブックは創業5年目で、ウーバーも創業した直後だった。

バークレーで彼は当時24歳で博士課程の学生だった前出のザハリアと組み、アパッチ・スパークを開発した。大手がニューラルネットワークを使ってやっていたことを、彼らは複雑なインターフェイス抜きで再現し、そのコードを無料で公開した。

その後、彼らはザハリアの論文指導教官だったスコット・シェンカーと、イオン・ストイカらの助言を受けて合計7人のメンバーで13年にデータブリックスを創業。ストイカは動画配信企業コンビーバの幹部で、シェンカーはネットワーク構築企業ニシラの初代CEOを務めていた。データブリックスではストイカがCEOに、ザハリアがCTOに就任し、シェンカーは取締役会の一員となった。

ニシラの初期投資家だったホロウィッツとのミーティングを、シェンカーが設定した。ゴディシらは本心ではこの面談に乗り気ではなかった。「ホロウィッツは研究者ではないので、彼から出資を受けたくないと思っていた」と、彼は振り返る。

「とりあえず数十万ドル程度を調達し、1年間プログラミングに取り組んでみて、何ができるか見てみよう、と考えたのです」

するとホロウィッツが面談で、「評価額5000万ドルで1400万ドルを出資する。のるかそるか、二つに一つだ」と、単刀直入に切り出した。あまりにも魅力的で断れない話だった。当のホロウィッツはその理由について次のように説明する。

「データブリックスのようなアイデアには、有効期限があります。大半の起業家の場合、シード資金から始めるのが正しいやり方ですが、彼らの場合は別でした」

データブリックスはその後、コンビーバの筆頭株主であるNEAのソンシーニを2社目のベンチャー投資家として引き入れた。14年当時、売り上げがまだないデータブリックスにNEAは3300万ドルを出資し、その際の評価額を2億5000万ドルに引き上げた。創業からわずか13カ月後のことだった。

将来的な成長を見越し、データブリックスは本社をサンフランシスコの高層ビルの13階へと移した。彼らは「13」という不吉な数字を気にせず、「安く借りられたのもそのおかげだ」と考えた。だが数カ月後、不吉な影が見え隠れし出した。

「市場戦略を決めるのに時間をかけ過ぎていた」と、ホロウィッツは言う。

アマゾン・ドット・コムなどの大手は、データブリックスを飛ばして、オープンソースで公開されたスパークを自社製品に組み込んでいた。ゴディシは、「収益はほとんどゼロだった」と語る。

そこで16年1月に新CEOに就任したゴディシは、直ちに3つの手を打つ。営業チームの増強と、経営チームの刷新、そして過度にオープンソースな製品になっていたスパークに保護領域を設け、営業担当者が売り出しやすい製品にすることだった。

しばらくして、アップダイナミクスなどの企業をイグジットへ導いた人々が、経営に加わった。核となるスパークのエンジンを活用した、新たなプラットフォームも好評を博した。データブリックスの売り上げは急速に伸び、16年には1200万ドルに達した。

ホロウィッツはその後、マイクロソフトのサティア・ナデラCEO宛てにメールを書き、「データブリックスはビッグデータにおける革命の先駆者だ」と売り込んだ。するとナデラからすぐに返事があり、マイクロソフトは年間売り上げ595億ドル(20年時点)の自社クラウドサービスに、「Azure Databricks(アジュール・データブリックス)」として組み込んだ。

18年、データブリックスは機械学習プロジェクトを管理するプラットフォーム「MLフロー」を公開し、翌19年には、企業がゼロからレイクハウスを構築せずに済む「デルタレイク」を発表。そのいずれも成功させた。今では、「スパーク」は顧客がデータブリックスを利用する理由の5%を占める程度だ。

「データブリックスは、スパークをはるかに超える企業に成長した」とホロウィッツは胸を張る。

今年2月に10億ドルを調達し、評価額が280億ドルに達したデータブリックスの好敵手は、スノーフレークだ。両社は3年前までは提携していたが、今では強烈なパンチを浴びせ合っている。

「スノーフレークは確かに優れた企業だが、この分野でデータブリックスをしのぐイノベーションを起こせる企業は他にない」と、ホロウィッツは言う。しかしゴディシは、スノーフレークだけでなく、自社に出資しているテック業界の巨人(アマゾン、マイクロソフト、グーグル)ですら、いつかはデータブリックスを脅かすかもしれないと考えている。

「周りの人たちは、私ほど心配性のCEOは他にいないと話します」

そう語るゴディシは、長年インテルを率いたアンディ・グローブの「パラノイア(異常な心配性)だけが生き残る」という言葉を座右の銘としている。戦争下で育ち、子供時代に人が死ぬのを目撃したゴディシは、従業員に年に1度、「空が落ちてくる」という名の講義を受けさせる。それは市場が干上がったり、恐慌が訪れたりした場合の心構えを説くもので、コロナ禍の際にもその備えが役立っている。

ゴディシは、私生活でさらに差し迫った事態に直面した。息子の腎臓がんだ。幸いなことに、ゴディシ夫妻はテクノロジーとデータ解析の進歩によって、息子の体内に腫瘍が出現する前にその兆候をつかむことができた。データブリックスのような企業は、製薬やヘルスケア関連の企業が次の一歩を踏み出せるよう支援している。それは、AIを活用して医療の進化を加速させることだ。「10年前なら、息子は助からなかったかもしれない」と、ゴディシは語る。

「こうしたテクノロジーは、力になるのです」

COLUMN|データを溜める倉庫と湖、そして「湖畔の倉庫」© Forbes JAPAN 提供

ビッグデータの時代といわれて久しいが、その膨大な量・性質のデータは分析・活用されてこそ初めて意味をもつ。そうしたデータを保管する代表的なサービスの一つが、データウェアハウス(Data Warehouse)だ。”データの倉庫”とも呼ばれ、基幹系などの複数の管理システムから必要なデータを収集し、目的別に再構成した統合データベースのことをいう。

それに対して、データレイク(Data Lake=データの湖)は、音声や動画、SNSのログを含むあらゆるデータをそのままの形で保存できる。データを構造化しておく必要がないため、データレイクにはさまざまなデータを迅速かつ安価に蓄積できる。ただし、何でも格納できるゆえ適切な管理がされていないと、欲しいデータを抽出するのが難しくなる。「データレイクハウス(Data Lakehouse)」は、両者をいいとこ取りしたデータ管理アーキテクチャで、データウェアハウスのデータ管理に、データレイクの柔軟性や経済性、スケーラビリティ(拡張性)、機能を取り入れたものだ。

データブリックス◎2013年創業、米カリフォルニア州サンフランシスコに拠点を置く人工知能(AI)・統合データ解析プラットフォーム開発企業。創業者は、「Apache Spark(アパッチ・スパーク)」を開発したカリフォルニア大学バークレー校の7人。データ管理・解析を革新した「レイクハウス」の普及を目指すデータ業界の旗手。

アリ・ゴディシ◎シリコンバレーの伝説的な起業家たちには、玩具の「レゴ」や「コモドール64」で育った人が少なからずいる。その例に漏れず、イランからスウェーデンへ移住したゴディシ(中央)も幼少時、両親に与えられたコモドール64でプログラミングを独学。自身もシリコンバレーに風穴を開けるスタートアップを作り上げた。

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中