“真実を話す人ほど、憎まれる人はいない。”
— プラトン
こんにちは、西田です!
昨日は一年でもっとも暑い時期となる、24節気でいう大暑でしたが、日本はいかがでしょうか?私の住むフロリダは、ビーチの海や屋外のプールの温度が35度くらいまで上がるので、お風呂に入っているような気分になるほど、熱いです!
ところで最近ChatGPTやMidjourneyなどを始め、AIを使ったプロダクトやサービスの進化のスピードがどんどん増しているようです。そこで、今回はAIに関連した3つの興味深いニュースやエッセイをみなさんと共有したいと思います。
それでは、さっそくいってみましょう!
最近の興味深いデータ関連記事
AI時代の「宣教師と密売人」
ChatGPTなどの最近のAIの進化を目にすると、いよいよ人間の仕事が失くなるとか、またはAIによって社会が破壊される、人類が滅ぼされるといった恐怖を煽る論調が増え、そこでAIには何らかの規制が必要だというムードが高まっていきます。
しかしこういうときこそ、過去を振り返りながら現在起きていることを一度冷静に分析することが重要ではないかと思います。そこで今回は、シリコンバレーで有名なベンチャーキャピタル、A16Zの代表であるマーク・アンドリーセンの長文エッセイの中の、「Baptists & Bootleggers(宣教師と密売人)」という部分を翻訳という形で皆さんと共有したいと思います。
「Baptists & Bootleggers(宣教師と密売人)」という言葉はアメリカが1920年代に経験した禁酒法の時代からの学びとして出てきた表現です。当時の敬虔なキリスト教徒たちによる道徳的な問題意識から始まった禁酒法が、結果として地下に潜って違法に酒を売っていたマフィアが巨大な力と利益を得ることを可能にしました。
その後も道徳的な社会運動が途中から経済的利益を追い求める人たちによって乗っ取られる現象を表すときに使われますが、マーク・アンドリーセンは現在AIの規制を求める運動でも同じことが起きていると言います。
AIのためのデータ生成を頼まれた人たちが、AIを使ってデータを生成していたという話
Artificial Artificial Artificial Intelligence: Crowd Workers Widely Use Large Language Models for Text Production Tasks - リンク
ChatGPTのようなLLM(Large Language Model)の精度を検証するには答え合わせが必要です。そこである研究者のグループが、Amazonのメカニカルタークという小さなタスクを少しのお金を払って世界中の人たちにアウトソースできるサービスを使って、研究論文などの要約をしてもらい、その結果とChatGPTなどが出してくる結果を比べて精度を評価しようとしました。
ところが、アウトソースした人たちから返ってきたデータを分析したところ、どうもChatGPTなどのサービスが返してきたデータとほぼ同じか、偶然ではないレベルで似通っていたことに気づいたとのことです。
なんと、アウトソースされた人たちの33%から46%、つまり半分近くの人たちがChatGPTなどを使って論文の要約を出し、それをコピーして提出してきたとのことです。まあ、普通に考えたらChatGPT使っちゃいますよね。
これからどんどんと人間のアウトプットが、それが世界中のどこからでも、みんな似通って来る、そんな面白くない時代になっていくのかもしれません。
相次ぐAIトレーニングデータに関する訴訟
Sarah Silverman sues Meta, OpenAI for copyright infringement - リンク
アメリカの有名女性コメディアンのサラ・シルバーマンがFacebookの親会社であるMetaとChatGPTを提供するOpenAIを相手に訴訟を起こしたというニュースがありました。
彼女に関する質問に対するChatGPTなどのサービスの回答が彼女のコメディの台本に沿ったものであり、彼女のこれまでのコメディ・ショーのスクリプトが大量に無断で、ChatGPTなどのモデルであるLLMのトレーニングデータとして使われていることが明らかだというのが、訴訟の根拠となっているようです。
このあたりの著作権がまだはっきりしないため、すでにアメリカではこの手の訴訟が特にアーティストからたくさん出てきています。Youtubeが始まったころも、著作権に関するルールがはっきりしなかったため、同じような混乱が生じていたのが思い出されます。シリコンバレーではよく、「Don’t ask for permission, ask for forgiveness.(やる前に許可を得るんじゃなく、やってから許しを請え)」と言われたりしますが、いい悪いは別にして、今回も同じ流れのようです。
今週のチャート
アメリカでは現在、障害者(精神的障害も含む)の人口が急激に増えています。上のチャートは16歳以上の障害者数の推移です。
理由として様々なものが挙げられると思いますが、そのうちの一つがワクチンと言われています。そこで2つのデータを合わせてみたのが以下のものです。
相関と因果は違います。しかし現在のところ、この障害者人口の急激な増加を説明するデータが他にないというのも事実です。このあたりの公的な検証が一刻も早く行われることを望みます。
データサイエンス・ブートキャンプ・トレーニング #32
次回のデータサイエンス・ブートキャンプは9月の開催となります。さらにその次の12月のブートキャンプの開催も決まりました!両方とも東京でクラスルーム形式での開催となり、現在参加申込受付中です!
ビジネスのデータ分析だけでなく、日常生活やキャリア構築にも役立つデータリテラシー、そして「よりよい意思決定」をしていくために必要になるデータをもとにした科学的思考もいっしょに身につけていただけるトレーニングとなっています。
データサイエンス、統計の手法、データ分析を1から体系的に学ぶことで、ビジネスの現場で使える実践的なスキルを身につけたいという方は、ぜひこの機会に参加をご検討ください!
日時:
2023年9月26日(火), 27日(水), 28日(木)
2023年12月12日(火), 13日(水), 14日(木)
場所:東京八重洲(対面形式)
アンケートデータ分析トレーニング #4(有料)
しばらくお休みにしておりましたアンケートデータ分析トレーニングが、新しくなってまた帰ってきます!今年11月にオンラインで開催することが決まりました!
アンケートデータを使って顧客をより深く、多面的に理解するために必要なデータの加工、可視化、そして分析手法を基礎から効率的に学び、現場で使えるスキルを身につけたい方は、ぜひこの機会に参加をご検討ください!
日時:2023/11/23(木)
場所:Zoom
以上となります。
それでは、素晴らしい週末をお送りください!
西田, Exploratory/CEO
KanAugust