「状況がやばくなるときというのは、君が何かを知らなかったときじゃなく、君が確実に知っていると思い込んでたことが実はそうでなかったというときだ。」
マーク・トウェイン
こんにちは、Exploratoryの西田です!
フロリダに引っ越してから2ヶ月になりますが、紆余曲折を経て全米で最も美しいビーチと言われているシエスタキーというビーチがあるサラソタという町に住むことになりました。
カリフォルニアからの引っ越しの荷物もようやく届き、こちらでの生活が本格的に始まりました。気候は温暖で(というか日中はこの時期でもしっかり暑い)とても暮らしやすいです。
しかしなんと言っても、ここフロリダではコロナはまるで過去の出来事のようで、普段の生活は完全に元通りといった感じです。私の住む町では学校も含め誰もマスクしていませんし、ワクチンの話もなく、スポーツやクリスマス関連のイベントは普通に開催されています。
2ヶ月前までいたカリフォルニアとはまるで違う世界です。
ところで先日、とある大学で「シリコンバレーの終焉と新しいアメリカの夜明け」というテーマの話をオンラインでさせていただきました。私がカリフォルニアを脱出してフロリダに引っ越した理由についても触れていますので、興味のある方はこちらの録画をぜひ見てみてください!
それでは、今週も行ってみましょう。
最近の興味深い英文の記事
不動産のマーケットプレイスZillowがアルゴリズムによる家の転売で大損失
Zillow to stop flipping homes for good as it stands to lose more than $550 million, will lay off a quarter of staff - Link
ちょっと前になりますが、Zillowという売りに出ているアメリカ中の家の詳細情報(値段も含む)が無料で見れるサービスがあります。そのZillowが家の転売ビジネスで$500ミリオンドル(約570億円)もの損失を出したというニュースがありました。
もともとのビジネスモデルはサイト上での広告や仲介費だったのですが、最近の不動産マーケットの好調に乗ってか、ここ数年は直接自らもたくさんの家を買って、それらをしばらくして売りに出すことでその差額を収益とするというビジネスに進出していました。
アメリカの不動産であればほぼ全てがこのサービスに出ているくらいですから、不動産の取引価格データという点では間違いなく大量に持っています。こうしたデータを元にアルゴリズムを使った予測モデルを作り、それを元に家の売買を行っていたとのことですが、下のチャートにあるように特に今年に入ってからの買いの件数はとんでもないレベルに達していました。
しかし、それに見合うほどに売れなかったらしく、ここ数ヶ月の間は一件の不動産を売り出すたびに$80,000(約900万円)ほどの損失を出していたとのこと。
その結果、今年の第3四半期は$304ミリオン(約350億円)ほど(確定)、第4四半期は$250ミリオン(約280億円)ほど(予測)の損失を出し、さらには従業員の25%を解雇することになってしまったとのことです。
昔よく株の売買をアルゴリズムでやって、何かのタイミングでとんでもない損失を出してしまうというのがありましたが、それと近い話ですね。
予測モデルを使うと短期的にはそれらしい結果が出るのですが、それを信用し過ぎてしまうと長期的には予測できない状況になり、大損失を起こしてしまうこともあるという教訓ですね。
特に今年になってからのアメリカの不動産マーケットはとてつもなくホットで、完全に売り手市場のため家を買うのも大変です。私が最近引っ越したフロリダでは、去年に比べて100%の上昇、つまり2倍になったという物件ばかりです。
そんな中でみんなの関心はこの「バブル」がいつ崩壊するかということに集まっていますが、そんなときに出てきたZillowの損失ニュース。これでいよいよ崩壊か、とざわついていましたが、今のところはまだそういった気配は見られません。
Google傘下の自動運転のWaymoがニューヨークでの実地テスト開始
Waymo will start testing self-driving cars in New York City - Link
今でこそ、コロナの影響で一時より落ちているとはいえ、アメリカで一番交通量と通行人の数が多く混雑しているニューヨーク市で、自動運転のWaymoが自動運転のテストを行うとのことです。
ただ、プレスリリースによると「人間が運転する」とあるので、いきなり無人の車が走り始めるというわけではなさそうです。
ちなみに、アメリカではカリフォルニアの都市をはじめ、すでに多くの都市で複数の自動運転技術を開発する会社が実地テストを行っています。
AIの近況レポート2021年版レポート
State of AI report - リンク
前回のNewsletterでも紹介した「AIの近況レポート2021年版」というレポートの中から他の興味深いトピックの紹介です。
モデル中心主義からデータ中心主義へ
最近では様々な機械学習のアルゴリズムがオープンソースという形で世の中に出回り、誰でもすぐに使える状況です。さらに、そうしたアルゴリズムを使って作られた予測モデルの精度を、モデルのパラメーターをチューニングすることによって上げていく手法も一般化されてきました。
そうすると、こういった予測モデルの精度の改善はすでに限界に来ていると言えます。そこでこれまで以上に、予測モデルを作るもととなるデータの品質にこそもっとお金と時間と努力を払うべきだとしていうのが、機械学習モデルの世界のトレンドのようです。つまりモデル中心主義からデータ中心主義へ、ということですね。
AI構築プロセスにおけるデータ・カスケード(階段状につながる滝)
前述のデータ中心主義の話と基本的に同じなのですが、問題定義、データの収集、ラベル付け、データの分析と加工、といった予測モデルを作るプロセスにおける上流でのタスクの品質が、最終的にモデルを評価するときになって見える形になって現れるが、そのときには影響が大きくなっているため、後から修正するのは大変です。そこで、そうした上流にあるステップでの作業にもっと注意が払われるべきだとのことです。
AI関連のユニコーンスタートアップ
AI関連のユニコーンスタートアップ(評価額が$1ビリオン / 約1100億円の未公開企業)は現在182社。USが103社とトップで、その次が中国の35社。日本はスマートニュースの1社のみ。ちなみにExploratoryがリストに入ってくるのはもう少し先になりそうです。😉
AIスタートアップの評価額の爆発的増加
エグジット(株式公開や買収など)したAIスタートアップの数自体はこの1年でそこまで増えたわけではないが、そうした企業の市場価値は圧倒的に増加しています。お金が余っているということなのでしょうか。
左が市場価値で、右がAIスタートアップの数です。
そうした投資のお金の多くはアメリカから来ていますが、ヨーロッパからの投資も最近は大きく増えているようです。
やはりネット・レベニュー・リテンション率と企業の時価総額の間には相関がある
Net Revenue Retention Drives Market Cap - リンク
カスタマーサクセス向けSaaSを提供するGainSightによる、ネット・レベニュー・リテンション率が企業の時価総額を牽引しているという記事です。
特に注目したいのは、ネット・レベニュー・リテンション率と企業の時価総額を測る指標の1つである売上高マルチプルの関係です。
2つの指標の相関の強さを測る指標であるR2乗値は0.54(54%)となっており、ネット・レベニュー・リテンション率によって企業の売上マルチプルのばらつきの54%を説明できることになり、両者の間には比較的強い相関関係があることが伺えます。
データサイエンス・ブートキャンプ・トレーニング #25
「データサイエンス・ブートキャンプ第24回」は来週の開催となり、受付はすでに終わっておりますが、次回来年2月に開催の「データサイエンス・ブートキャンプ第25回」の方はすでに受付を開始しております。
データリテラシーを高めたい、またはデータサイエンス、統計の手法、データ分析を1から体系的に学び、ビジネスの現場で使える実践的なスキルをつけたいという方は、ぜひこの機会に参加をご検討ください!
早割(10%オフ)は 12/15までとなっておりますので、参加を検討されている方はお早めにお申し込みください!
日時: 2022/2/15(火), 16(水), 17(木)
講師:西田勘一郎
データラングリング・トレーニング #5
データ分析の8割の時間はデータラングリング(データの加工)に費やされているとよく言われます。データをいかに自由自在に扱うことができるかが、データ分析の質を決めると行っても過言ではないでしょう。
そこで、現場で使えるデータラングリングのスキルを1から体系的に、そして効率的に身に着けていただくためのトレーニングを提供しています。
次回の開催は1月となります!
日時: 2022/1/19(水), 20(木)
講師:西田勘一郎、白戸敬登
今週は以上です!
西田, Exploratory/CEO
KanAugust