"真実を受け入れるのは難しい、抱いていた幻想を壊されたくないからだ"
ニーチェ
こんにちは、西田です!
毎年この時期になると、今から80年近く前に起きた人類史最悪の人道犯罪とも言える広島、長崎への原爆投下の悲劇に思いを馳せることになります。ただ、アメリカに住んでいるとこの時期は、「本土決戦になったら犠牲になったであろう100万人にも上るアメリカ兵を救うためにしょうがなかった」という、この犯罪を正当化するための記事やニュースが大量に流され、正直うんざりする時期でもあります。
そこでこの機会に、ほんとうに「しょうがなかった」のか、当時の歴史的事実を整理するために「勝者に何が道徳か定義させるな - 広島はいつも無防備だった」という記事を訳しました。興味のある方は、ぜひ読んでみて下さい。
少し本筋から離れましたが、それでは今回も、いくつかのデータ・AI関連記事をみなさんと共有したいと思います!
最近の興味深いデータ関連記事
AIは本当に私達人間を殺すときが来るのか?
最近のChatGPTなどの新しいタイプのAI、またはテクノロジーが出てくると、それが何ができて何ができないのかはっきりしないうちは特に、私達人間は未知のものに対する恐怖の感覚を持ちます。
そこに今度は、熟考に値するものから、ただのエンターテイメントとして切り捨てるべきものまで含め、様々なタイプの危険を煽る人たちがメディアにたくさん出てきます。
すると、生存競争に勝ち残ってきた私達人類は本能的に心配性なので、こうした話に飛びつき、その合理性を検証することなく、簡単に信じてしまう傾向があります。
そこで、前回の「AI時代の宣教師と密売人」に引き続き、シリコンバレーの有名投資家、起業家であるマーク・アンドリーセンの「Why AI Will Save the World」という長文エッセイの中から、今回は「AI Risk #1: Will AI kill us all?(AIは私達人類を殺戮するのか?)」という部分を翻訳してみなさんと共有したいと思います。
AIのリスクについて冷静に分析、議論するさいのきっかけになればなと思います。
オープンなAIとクローズドなAI
Introducing Llama2 - リンク
最近Facebook(Meta)がLlamaというChatGPTに競合するLLM(Large Language Model)をリリースしました。(このモデルはPerplexity Labから試すことができます。)これがChatGPTなどに比べてユニークなのは、オープンな環境で開発されたという点です。これがなぜ重要なのか、少し背景の方を簡単に説明します。
ChatGPTはOpenAIというシリコンバレーのスタートアップによって開発されたものですが、とても不思議なことがあります。それは開発元のOpenAIという会社はChatGPTをオープン、つまり誰もがそのコードやモデルにアクセスできるように「オープン」にしていないという点です。
実は、ChatGPTのコアとなる技術がトランスフォーマーというものなのですが、これは2017年ころに、Googleのある研究チームによって開発されたものでした。このニュースを聞いたイーロン・マスクは、Googleの当時のCEOであったラリー・ページに直接会って彼の懸念を伝えました。というのも、GoogleがこのAIのブレイクスルーの技術を独占してしまえば、Googleが(ChatGPTのように)何が「真実」で何が「嘘」なのかを定義できるようになってしまうことを彼は危険だと思ったからです。
そのため、イーロン・マスクはその技術を使って開発するAIはそのソースを公開するように求めたが、ラリー・ページは聞く耳を持たず、自社でクローズドな環境で開発を続けると言いました。
そこで、イーロン・マスクは現OpenAIのCEOであるサム・アルトマンといっしょに、ソースコードをオープンな環境で開発し、誰もがソースやモデルにアクセスできるAIを開発するために「OpenAI」を非営利組織の形でサンフランシスコで起ち上げ、1億ドルにも上るお金を投資したと言われています。
ところが途中からOpenAIの進むべき方向に関して意見に違いが出始め、さらにイーロン・マスクは本業であったTeslaやSpaceXなどの仕事が忙しかったために、OpenAIと袂を立つこととなりました。
その後、OpenAIはChatGPTを含むいくつかのAIプロダクトや技術をクローズドな環境で開発し、2019年にはマイクロソフトから投資を受け、パートナー契約を結び、その過程で営利目的の会社と転換することとなりました。
しかし、シリコンバレーには「オープン」を求める根強い文化があります。そこで多くのLLMモデルがオープンな環境で開発されているのですが、LLMモデルには大量のデータとそれを処理するのに必要な大量の半導体が必要となります。もちろん、それには大きなお金がかかります。
そこに出てきたのが、Facebook(Meta)がオープンな環境で開発し最近リリースしたLlamaというわけです。(正確には今のところオープンソースではなく、オープンリリース / オープンイノベーションらしいです。リンク)
月次ユーザーの数が7億を超えない限りは、このモデルは商業用に誰が使っても問題ないとのことです。つまり、同規模の競合(例えば、Google、Twitterなど)でない限りはオッケーということなのでしょう。
AIはオープンで開発されるべきか、クローズドで開発されるべきか、これに関しては実はシリコンバレーでも意見がわかれます。
AIは危険なものだと主張する人たちからすれば、そんなものをオープンにしてどこの誰ともわからないやつらが手にして勝手なことをし始めるのは危険だとなります。逆に、そんな危険なものであれば、それを一部の企業に独占させるほうが危険だという意見もあります。
オープンな環境での開発を求める人たちのリスト - リンク
みなさんはどう思いますか?
読み手に伝わりやすくするために色を使って一部をハイライト
Emphasize what you want readers to see with color - リンク
チャートを使ってデータを可視化し、それをレポートの形で他の人と共有したり、またはミーティングの場でプレゼンテーションとして他の人に見せたりすることはよくあると思います。
しかしこのとき、何がすごいのか、何に注目すべきなのかをうまく一瞬で見せることができなければ、せっかく時間をかけてそのチャートを作ったとしても、みんなの記憶の彼方に葬られてしまいます。
そこでよく使われる手法として、自分が強調したいポイントを色を使ってハイライトする方法があるのですが、データの可視化のエキスパートであるLisa Charlotteが最近、ハイライトするさいに気をつけるべきこと、色の選び方などをこちらのブログ記事にまとめていました。
英語ですが、英語が読めなくても以下のようなイラストがたくさんあるので、それらを見ているだけでも勉強になるかと思います。
Exploratoryにも簡単にチャートの一部をハイライトできる機能があるので、ユーザーの方はぜひ使ってみて下さい。こちらにハイライト機能に関してのガイドがいくつかあります。
今週のチャート
上のチャートはそれぞれの国での寒さによる超過死亡(青)と熱さによる超過死亡(赤)を比べたもので、今年3月にイギリスの研究チームが世界で権威のある「医療誌」ランセットに出された論文「Excess mortality attributed to heat and cold: a health impact assessment study in 854 cities in Europe」からのものです。
このチャートを見て、何かおかしな点に気づきましたか?
よく目を凝らして見ると、X軸のスケールがおかしいことに気づきます。 X軸は10万人あたりの超過死亡数を表しているはずなのですが、 寒さ(青)と熱さ(赤)で目盛りの増え方が5倍ほど違います。
X軸の目盛りが修正されたチャートがこちらです。
1つ目のチャートを見た人は、 X軸に注意を払わなければ どう思うでしょうか? 多くの国では、温暖化によって死ぬ人が寒さによって死ぬ人と同じくらいだ、 温暖化は問題だ、となるのではないでしょうか。
逆に、修正されたチャートを見た人はどう思うでしょうか? 地球温暖化するほうが、寒冷化よりマシじゃないか、と思うのではないでしょうか。 そして、実際そうなのです。
この地球温暖化に関しては、こちらにTwitterのスレッドとして出しているので、興味のある方はぜひ見てみて下さい。
データサイエンス・ブートキャンプ・トレーニング #32
次回のデータサイエンス・ブートキャンプは9月の開催となります。今回もまた東京でクラスルーム形式での開催となります!
ビジネスのデータ分析だけでなく、日常生活やキャリア構築にも役立つデータリテラシー、そして「よりよい意思決定」をしていくために必要になるデータをもとにした科学的思考もいっしょに身につけていただけるトレーニングとなっています。
データサイエンス、統計の手法、データ分析を1から体系的に学ぶことで、ビジネスの現場で使える実践的なスキルを身につけたいという方は、ぜひこの機会に参加をご検討ください!
日時:
2023年9月26日(火), 27日(水), 28日(木)
場所:東京八重洲(対面形式)
アンケートデータ分析トレーニング #4(有料)
しばらくお休みにしておりましたアンケートデータ分析トレーニングが、新しくなってまた帰ってきます!今年11月にオンラインで開催することが決まりました!
アンケートデータを使って顧客をより深く、多面的に理解するために必要なデータの加工、可視化、そして分析手法を基礎から効率的に学び、現場で使えるスキルを身につけたい方は、ぜひこの機会に参加をご検討ください!
日時:2023/11/23(木)
場所:Zoom
以上となります。
それでは、素晴らしい週末をお送りください!
西田, Exploratory/CEO
KanAugust