こんにちは、Exploratoryの西田です。
去年1月以降、かれこれ1年8ヶ月ほどコロナによって世界中は混乱に陥りましたが、北欧のような一部の国やアメリカでもフロリダやテキサスなどを含む半分ほどの州ではすでに全ての規制がなくなり、ほぼコロナ以前の日常に戻っています。
日本では多くの地域でまだ緊急事態宣言が続いていると聞いておりますが、そろそろ収束に向かっていくのではと期待しております。少なくとも、そういう方向にしっかりと責任を持って進めていってくれる人が次の総理大臣になっていただければと願っております。
それでは、今週のWeekly Update、さっそくいってみましょう!
最近の興味深い英文の記事
機械学習における第一のルールは機械学習なしで始めること
The First Rule of Machine Learning: Start without Machine Learning - Link
機械学習を使うプロジェクトを始めるときは、大抵の場合機械学習を使わない、ということに関して書かれた記事です。
普段からこうしたプロジェクトに関わっている人であれば、ある意味当たり前のことかもしれません。機械学習のモデルを作るにはまずデータが必要なので、そもそもデータがあるのか、集めることができるのか、そしてここが重要なのですが、集めることができたとしてそのデータは「使える」ものなのか、こうしたことを判断するために最初に多くの時間が費やされます。
もしデータを取得できたのであれば、いきなり機械学習のモデルを作るのではなく、統計の手法を使ったりデータを可視化したりして手元にあるデータを理解し始めます。たいていの場合はデータが汚かったりするのできれいにしたり、整える必要もあります。
さらに、データの中に「使える」関係があるか見ていくことになるのですが、実はこうした関係を見つけることができれば、それをもとに人間が推測することで、機械学習のモデルを使うことなしに問題を解決できてしまうということもよくあります。
Jupiterネットワークのデータ漏洩はアメリカ政府のせい
Juniper Breach Mystery Starts to Clear With New Details on Hackers and U.S. Role - Link
アメリカ国家安全保障局(NSA / National Security Agency)が、企業向けに通信ネットワークを提供しているJuniper Networkのネットワークに自分たちが裏から勝手に入れるようにセキュリティの穴(バックドア)をわざと開けさせておいたら、その穴を中国政府とつながっているハッカー集団に見つかって、数年に渡り機密性の高い顧客やアメリカ軍の通信データをすっぽり引き抜かれていた、という笑えない話です。
アメリカなどの政府はAppleやGoogleなどにバックドアを用意しろと執拗に要求しているのですが、こういったことになるのでできないとAppleなどは公式には否定し続けています。「だから言っただろう」というかんじなのでしょうか。
至上最速クラスのスピードで成長するSaaS Hopinから学ぶべきこと
What You Learn at a Startup that Grows from $0 to $7.75 Billion in 2 Years - リンク
米国を代表するベンチャーキャピタルAndreessen Horowitzなどの投資を受け、驚異的なスピードで企業価値を高めている、バーチャルイベントプラットフォームのHopinが創業から現在に至るまでの学びに関する記事です。
その中で特に注目したいのが、マネジメントメンバーは一般的に言われているような様々な指標に惑わされることなく、自分たちにとって最も重要なNorth Star Metric(北極星指標)となりうる指標を定義し、それを絶えずチームのメンバーと共有し、それをもとに経営戦略を実行し続けてきたことです。
North Start Metrics(北極星指標)に関しては、以下のページに詳しくまとめていますので、興味のある方はぜひご参照下さい。
グロースハックの生みの親が、KPIの前にまずは北極星となる指標を定義しろと主張するわけ - Qiita - リンク
シリコンバレーの企業は、どうやってNorth Star指標を選んでいるのか? -リンク
プロダクト・レッド・グロースの達成を測る11の指標
11 essential product metrics for measuring product-led growth - リンク
最近SaaSの世界では、プロダクト自身がビジネスの成長を牽引していくタイプの「プロダクト・レッド・グロース」という成長モデルに注目が集まっています。このプロダクト・レッド・グロースを測る指標の例を紹介する記事です。
その中でも特に注目したいのは、以下の5つの指標で、これらの指標はより直接的に「プロダクト・レッド・グロース」を達成できているのかを測る指標として参考にできそうです。
Time to value(製品の価値を認識するまでの時間)
Product-qualified leads(製品からもたらされるリード数)
Net revenue retention(ネット・レベニュー・リテンション)
Customer satisfaction score (CSAT)(顧客満足度)
Virality(口コミ係数)
共和党と民主党という2つの世界
Wider partisan gaps emerge in trust of national and local news organizations, social media - Link
現在アメリカでは共和党支持の人たちと民主党支持の人たちが見ている世界が全く違います。これは共和党支持の人たちが、伝統的な全国メディア(ニューヨーク・タイムズ、CNNなど)に対する信用を無くしてしまったということが大きいと思います。
以下は世論調査会社のピュー・リサーチ・センターによるメディアに対する信用度調査の結果です。
一番左側が全国メディアに対する信用度ですが、赤の共和党は2016年(トランプが大統領になった選挙があった年)に比べて大きく下がっているのがわかると思います。
このことは、アメリカ人と話すときには頭に入れておいてもよいのではと思います。
アメリカ政府は2020年にどれだけお金を集めて、そして使ったのか
How much money did the federal government collect and spend in 2020? - Link
アメリカの財務省のデータ共有サイトの方に、2020年のアメリカ政府の収入と支出データを可視化したものがあります。それぞれのデータをダウンロードできるようにもなっています。
去年のアメリカ政府の支出は6.55トリリオンドル(約725兆円)とのことです。
ほぼ税金による収入が3.42トリリオンドルだったので、収入の倍近くを支出したことになります。
現在政府の借金は26.95トリリオンドルとのことですが、去年1年で4.2トリリオンドルを追加したとのこと。
アメリカ政府は現在借金を気にすることもなければ、支出を止める気もないようです。まるで打ち出の小槌でもあるかのようですが、私たちの生きている世界はおとぎ話の世界ではないので、いずれ厳しい現実に直面するときが来るのではないでしょうか。
ちなみにアメリカ財務省のオープンデータはこちらより探すことできます。
今週の名言
「どうして君は他人の報告を信じるばかりで、自分の眼で観察したり見たりしなかったのか」
ガリレオ・ガリレイ
Exploratory データ・アカデミー
データサイエンス・ブートキャンプ・トレーニング #24
毎回好評をいただいているデータサイエンス・ブートキャンプですが、次回は11月の開催となります。
データリテラシーを高めたい、またはデータサイエンス、統計の手法、データ分析を1から体系的に学び、ビジネスの現場で使える実践的なスキルをつけたいという方は、ぜひこの機会に参加をご検討ください!
日時: 2021/11/9(火), 10(水), 11(木)
講師:西田勘一郎
データサイエンス勉強会 #21
11月12日(金)に「Exploratoryデータサイエンス勉強会 #21」を開催します!
今回も4人のExploratoryユーザーの方たちに、具体的なデータに関する取り組みやデータ分析のリアルの話を共有していただく予定です!
私の方からもいつものようにExploratoryの時期リリースであるv6.8のアップデートをさせていただきます。
お時間の都合のつく方は、以下の詳細ページより参加をお申し込みの上ご参加下さい!
なお今回もオンラインでの開催となります。
今週は以上です。
それでは、素晴らしい週末を!
西田, Exploratory/CEO
KanAugust