Exploratory Newsletter Vol. 87
“バカな奴は単純なことを複雑に考える。普通の奴は複雑なことを複雑に考える。賢い奴は複雑なことを単純に考える。”
稲森和夫
こんにちは、西田です!
2週間前ほどにデータリテラシー・シリーズの一環として「ハリケーンと地球温暖化は関係あるのか」というセミナーを行い、データを使いながらハリケーンと地球温暖化は関係ないということを検証していきました。詳しくはこちらの録画をご覧ください。
ところで、このセミナーの中で「情報カスケード」の話をしたのですが、セミナー後に多くの人から「初めて聞いた」と意見をいただいたので、改めてブログポストとして解説記事を書きました。
情報カスケードによって簡単に作られてしまう嘘の世界 - リンク
私達が、とくにマスコミから得られた情報を元に「正しい」とか「真実」だと思っていることは、実は違ってたということはよくあります。特にこの3年ほど、コロナに関するニュースにおいてはその傾向がひどかったと思います。
上記のセミナーのように自分でデータを手に取り検証してみたり、自分で経験してみたり、情報の1次ソースに触れたり読んだりしてみれば、マスコミによって作られていく世界が現実世界といかに違うかということを認識することができるのですが、「情報カスケード」によって一度出来上がってしまった認識の世界を覆すことは、「情報カスケード」の性質上なかなか難しいというのが現実でもあります。
しかし、解決方法はあります。それは自分が見たこと体験したことを、恐れず隠さず嘘をつくことなしに積極的に他の人達にも伝えていくということです。
詳しくはこちらの記事の方に説明してありますが、データを使える人こそ自分の「専門外」であっても「自分が見たこと、わかったこと」を間違いを恐れずに、もっと積極的に発信していっていただければと思います。
それでは以下、データに関する興味深い記事の紹介です。
最近の興味深い英文の記事
アメリカと中国の半導体戦争
Choking Off China’s Access to the Future of AI - リンク
2年ほど前にも別の記事で触れましたが(リンク)、これまでAIの世界では中国の企業や研究プロジェクトが凄まじい勢いで成長し、AI企業の数、AIに関する論文の数、研究者の数でもアメリカに追いつき、追い越すレベルに成長してきていました。
US、ヨーロッパ、中国の3者によるAIレースの行方 - リンク
中国を含む世界のAIを支えるのはコンピューターの頭脳であるGPUですが、そうした半導体のほとんどは台湾で作られ、アメリカでデザインされています。
そこで先月(10月)アメリカ政府は半導体、さらに半導体の生産に必要な機器などの中国への輸出を禁止する大統領令を発表し、即日執行し始めました。これによって、中国企業はアメリカの半導体企業であるNvidiaやAMDなどからGPU等を含む機器を仕入れることができなくなりました。これはアメリカ企業だけでなく、アメリカ製のソフトウェアや製品を使っている企業にも適用されるという影響範囲の大きなもので、台湾で生産されている半導体はほぼ中国に輸出できなくなってしまったようです。
さらに中国にある半導体企業で働くアメリカ人およびアメリカの国籍を持っている人(2重国籍)は即時辞めるかアメリカ国籍を諦めるかの2択を迫られたそうで、アメリカ人の大量帰国によって、中国のAI、半導体企業には混乱が起きているとのことでした。
中国は半導体産業でリーダーになる、2020年までにAI分野でアメリカに追いつく、2025年までにAIの技術に関して大きなブレイクスルーを生み出す、2030年までにAIが中国の経済の基盤になる、といった大きな目標を立て着々と実行に移していましたが、その計画はしばらく頓挫することになりそうです。
さらに、この8月にはアメリカは「CHIPS and Science Act」という法案を議会で通しています。これはアメリカの半導体企業に国内で生産することに対して税金控除などのインセンティブを与えるものです。
この効果は実際に出始めていて、Intelはオハイオ州で20ビリオンドル(約3兆円)の規模の工場の建設を始め、世界の先端半導体生産の多くを占める台湾のTSMCはアリゾナ州で12ビリオンドル(約1.8兆円)規模の工場を、サムソンはテキサス州で17ビリオンドル(2.5兆円)規模の工場を建てる計画とのこと。
アメリカと中国の間の摩擦は日に日に大きくなってきていますが、中国はAIテクノロジーの最も重要な部分をアメリカに抑えられた形です。まるで、太平洋戦争が始まる前に、アメリカ陣営によって石油を止められた日本のようです。
気になるのは、現在半導体生産のメッカである台湾はアメリカにとっても中国にとっても戦略的に重要な場所であるということです。半導体が喉から手が出るほどに必要な中国は台湾をどんな手段を使ってでも「自国」として押さえたい理由が一つ増えたということです。
アメリカとEU間のデータ保護に関する取り決め
Biden signs executive order with new framework to protect data transfers between the U.S. and EU - リンク
EUはGDPRのような個人データの保護に関して厳しいルールを持っていますが、アメリカのルールと噛み合わないので、アメリカ企業は何に従えばよいのか混乱が生じていました。
エドワード・スノーデンによる暴露などによって、今やアメリカ政府の諜報機関などはインターネットや電話回線などを通して世界中の国で個人やビジネス、さらには政治家のデータさえもを収集しているのは広く一般に知られていることです。(もちろん、こうしたことはアメリカ政府だけではありませんが。)
こうしたことに以前から懸念していたEUの要求に答える形で、アメリカとEUとの間のデータの取扱について合意に達したとのことです。
これは日本にとっても重要です。というのも、すでに日本の多くの企業、そして最近では政府機関もアメリカのクラウドサービスを使うようになっていますが、こうした「プライベート」企業が提供するクラウドに保存されるデータは、要望に応じてアメリカ政府に提供されたり、またはいつでも秘密の扉(バックドア)から閲覧可能になっていたりするものです。
このような現状を許してしまえば、日本政府、ビジネスは二度とアメリカ側との交渉に勝てることはなくなるでしょう。
自動運転業界の冬到来
Even After $100 Billion, Self-Driving Cars Are Going Nowhere - リンク
近年、TeslaやGoogle傘下のWaymoといった企業は自動運転が当たり前になる世界はもうすぐそこにあるかのように主張してきました。そうしてこの10年ほどの間に10兆円以上の投資がこの業界には投下されました。ところが、ここに来てどうやら自動運転はまだまだ先の話になりそうという話をよく聞くようになってきました。
こちらの記事の中では、そもそもこの自動運転ブームの火付け役であるWaymo創業者のアンソニー・レバンドウスキー、(後にUberに移りWaymoを傘下に持つGoogleに訴えられた人でもあります。)さえもがいわゆる自動運転はあきらめているかのようです。
2008年にレバンドウスキーのチームは有名なプリウスを使った自動運転のデモを行いました。それはサンフランシスコからベイブリッジを渡ってトレジャーアイランドに行くというものでしたが、こちらのビデオを見てもわかるように、周りをたくさんの車に囲まれ、一般の通行車からは完全に守られた状態でした。
しかしこのデモによって、Levandowskiのチームは「これはデモだが、後は足りないものを追加、改善していけば、自動運転はもうすぐそこにある!」と興奮し、その後も自動運転の改善に取り組み続けたらしいのですが、2018年頃にはそうした自動運転の実現の可能性に疑問を持ち始めたとのことです。
コンピュータービジョンを使ったデモを通して、彼らは人間とコンピューターが同じように「考えている」と信じたとのことです。コンピューターが映し出す3Dの世界を見ると、コンピューターには全てが見えていて、さらに次に何が起きるかまで理解できるのだ、と思い込んだらしいのですが、その後「コンピューターは未だにかなりバカだ」と思うに至ったとのことです。
テスラには自動運転機能がすでに組み込まれていますが、テスラでさえこの自動運転機能は人間がハンドルを握っていないと使えないことになっています。そのテスラのCEOであるイーロン・マスクも今年はじめのインタビューで、「自動運転は難しいとは思っていたが、やってみると想像したよりさらに難しいものだった」と言い、その不可能とまで言える難しさを説明していました。
現在、前出のレバンドウスキーは産業サイト(採掘現場など)で使われるトラックを自動運転させるテクノロジーを提供するProntoという会社でCEOをやっているとのことですが、これが自動運転の現在における限界のようです。
90%のところまではできても最後の10%がそれまでの90%よりもはるかに大変で時間もかかるということはよくありますが、自動運転もそうした例から漏れることはないようです。無人の車が街を走る世界というのは、この先5年、10年、またはもっとかかるのかもしれません。
トヨタのデータブリーチ
Toyota Suffered a Data Breach by Accidentally Exposing A Secret Key Publicly On GitHub - リンク
ちょっと前になりますが、トヨタのデータ漏洩のニュースがありました。
Tコネクトというシステムの開発コードの一部がGithubに「パブリック」な状態でなんと5年間も公開されていたとのことで、この中には30万近くの顧客データへアクセスできるコードが入っていたとのことです。
データ漏洩というとプロのハッカー集団に侵入されるような状況を想像しがちですが、このような「うっかり」ミスによるデータ漏洩というのはよくあります。
Exploratoryの方でも、日本のお客様と契約させていただく際に、事前に100とか200もあるセキュリティに関する質問がならんだスプレッドシートを埋めるように要望いただくことがあります。それはそれで背景を理解できるのですが、結局どれだけ事前にベンダーやサードパーティのサービス提供者にセキュリティに関する確認をしてみても、こうした内部的なミスからデータ漏洩というのは起きるわけですから、特にインターネット上のセキュリティというのはつくづく難しいと感じます。
データサイエンス・ブートキャンプ・トレーニング #29 & #30
次回の「データサイエンス・ブートキャンプ」は来年1月、さらに3月のそれぞれ3日間集中コースとなっております。
データサイエンス、統計の手法、データ分析を1から体系的に学ぶことで、ビジネスの現場で使える実践的なスキルを身につけたいという方は、ぜひこの機会に参加をご検討ください!
ビジネスのデータ分析だけでなく、日常生活やキャリア構築にも役立つデータリテラシー、そして「よりよい意思決定」をしていくために必要になるデータをもとにした科学的思考もいっしょに身につけていただけるトレーニングとなっています。
日時:
平日3日間コース: 2023年1月18日(水), 19日(木), 20日(金)
平日3日間コース: 2023年3月22日(水), 23日(木), 24日(金)
SaaS/サブスク型ビジネスのためのデータ分析トレーニング 12月開催
SaaSやサブスクリプションビジネスの改善に必須である、ビジネス指標(KPI)の定義、コンバージョンやチャーン(解約)の要因分析、さらにそれらの先行指標となるエンゲージメントの計算方法や分析手法といったものを一気にハンズオンを通して学ぶことで、即現場で使えるスキルを身につけていただくためのトレーニングです。
日時: 平日2日間コース: 2022/12/8 (木)、9 (金)
今週は以上です!
それでは、引き続きよろしくお願いいたします!
西田, Exploratory/CEO
KanAugust