Exploratory Newsletter Vol. 72
こんにちは、Exploratoryの西田です。
先月の初めにカリフォルニアからフロリダに引っ越して来て以来、ずっと家探しをしていましたが、ようやくここマイアミに家が見つかりました。これから、マイアミを本拠地として本格的に活動を開始していきたいと思います。ちなみに、日本との時差は13時間となります。😱
それでは、今週のWeekly Update、さっそくいってみましょう!
最近の興味深い英文の記事
AIの近況レポート2021年版
この1年でのAIに関する最新のトレンドを、研究、人材、ビジネス、政治と言う観点からまとめた200ページ近くに上るスライド形式のレポート「State of AI Report 2021」が出ていたので、いくつか興味深いと思ったものをここで簡単に紹介したいと思います。
AIと医療
この1年、AIは医療分野においてなんとも失望するものでした。
まずは、これまでAIと医療というとよく取り上げられてきたものに、レントゲン写真と画像認識の技術を使った癌の早期発見というのがありました。
その中でもマンモグラフィー(乳癌の早期発見のために人の乳房をX線撮影する手法)においては、もともとレントゲン技師よりも正確に癌を認識できると主張する36にも上るAIシステムが過去に発表されていました。しかしそれらを実際に調べてみたところ、なんと94%のシステムは1人のレントゲン技師よりも不正確であり、さらに全てのシステムは2、3人のレントゲン医師によって得られる結果よりも劣っていたとのこと。(詳細)
2つめの失望はこの2年近く私達の日常が大きく変わることになってしまったコロナウイルスに関してです。
日本でも感染症の専門家を名乗る人達による全く当たらない感染者数や死亡者数の予測が問題になりました。予測が当たらないだけではなく、なぜ当たらなかったのかの説明もなしに、その後も同じモデルを使ってでたらめな予測を出し続けるといった有様でした。それをなんの検証もなしに鵜呑みにし報道し続けたメディアにも責任があると思いますが、こうした予測による恐怖の拡散はその後、効果を確認することができない非常事態宣言や蔓延防止対策の乱発、無観客のオリンピック、といった異常な事態を引き起こし、日本中がパニックと悲観的なムードに長い間襲われてしまったのは大変残念なことでありました。
ところで、この失望は感染者数や死亡者数の予測を外すということだけにとどまりませんでした。上記に上げたような「AIを使った診断」という点に関して、コロナに関してもやはり特に役立つ結果を出すことができませんでした。
「大きな期待があり、機械学習のコミュニティから多くの人達が参加したにもかかわらず、結果として機械学習のコミュニティによるポジティブな影響はほぼなかった。もっともよくある解決できそうな問題の一つに、胸部のレントゲン写真からコロナウイルスを認識するというものがあるが、これは世界で共通した医療的な失敗であった。」
「2020年にパブリッシュされた、COVID-19の診断と予知のために機械学習を使ったと報告されている論文の全てを体系的にレビューした結果、医療の現場で使うに当たり必要とされる信頼性と再現性のレベルに達するものは一つもなかった。使われた手法、データの不備、バイアスの問題といった多くの問題があった。」
AI人材
このレポートの中にはAI、データサイエンス、サイエンス関連の人材に関するトレンドもあります。
例えば、ブラジルとインドではAI人材の獲得数が急速に伸びています。2017年からの伸び率で見るとUSや中国以上です。
さらに、中国はSTEM(Science, Technology, Engineering, and Mathematics)分野の人材の創出がこの20年近くの間で大きく伸びています。
2005年のあたりで、中国のSTEM分野のPhD(博士号)をとった卒業生の数(赤)はアメリカを抜きました。2012年から2021年の間に、中国政府は高度教育への投資を倍増し、そのおかげでPhDをとった卒業生の数は40%増加。さらに、この分野のPhDプログラムを2003年から2007年の間にゼロから新規に1300作ったとのことです。
逆に、アメリカやヨーロッパで共通した問題なのが、伸びつつあるAIやデータサイエンス分野で、教える先生と学ぶ生徒の間にある需給のギャップです。
以下はAIやデータサイエンスを学ぶことができる応用科学の分野のドイツの大学の例ですが、上から2番めの薄い青の線が生徒数で右肩上がりなのに対して、下から2番めの濃い青が教授の数で、ほぼ横ばいです。
応募する生徒の数はどんどんと増えてきているにも関わらず、教えることのできる先生の数はなかなか簡単に増やせるわけではないため、1人の先生に対する生徒の割合が大きく増えてきているとのことです。
AIの世界では様々な分野で現在でもアメリカがダントツでトップですが、中国が着実にその差を埋めつつあります。特に大学などによるこの分野での研究と人材育成においてはすでに同じレベルにあるといえるようです。
200ページ近くになるAI業界でのトレンドがわかる情報量盛りだくさんのレポートで、他にもいくつかみなさんと共有したいトピックがあるのですが、そちらは来週のWeekly Reportでまた報告します!
CSAT(顧客満足度)はサポートエージェントのパフォーマンスを測るのに適切な指標ではない
カスタマーサポート向けのSaaSサービスであるMaestroQAが、265,000件以上のEコマースビジネスのサポートチケットを分析したレポート「Industry Report: 2021 eCommerce Essentials 」が出ていました。
特に注目したいのが、サポートに寄せられた問い合わせを高い品質で対応しても、3割以上の人が、低いCSAT(顧客満足度)を付けるということです。
質の良い対応をしても、CSAT(顧客満足度)との関係が弱いようであれば、CSAT(顧客満足度)をサポートエージェントの評価の指標とするときは注意した方がいいですね。
CSATの指標については、以下のセミナーでも紹介していますので、興味のある方はご覧ください。
SaaS アナリティクス #11 - CES(顧客努力指標) - リンク
カスタマーサクセスがいる企業の60%以上はNPSを利用
アンケートプラットフォームを提供するSaaSのSurveySpparowが、カスタマーサクセス担当者を置いている企業126社を対象に実施した調査を「State of Customer Success| Customer Success Takeaways For 2021 」というレポートにまとめています。
調査対象の126社のうち、NPSを利用している企業は全体の63%とのことで、さすがにNPS(ネット・プロモーター・スコア)の浸透率が高いようです。
NPSに関しては、その計算方法やモニタリングのしかたなどを紹介した記事があるので、興味のある方はご覧ください。
SaaS アナリティクス #9 - NPS(ネット・プロモーター・スコア)の計算 - リンク
今週の名言
統計学は、科学的探求のためのものであり、それをいかにうまくやるかというものである。しかし、多くの統計学者は統計学とは数学の一部だと信じてしまっている。
ジョージ・ボックス、統計学者
EDAサロン
現在EDAサロン開催中です!
EDAサロンとは、私たちExploratoryが出題するデータを使ってみなさんに自由に分析や可視化をしていただき、「実際にやりながら学ぶ」をテーマにしている取り組みです。
今回は、Twitterのツイートテキストを使った分析または可視化をみんなでしてみようということで現在開催中です。興味のある方はぜひお気軽にご参加下さい!
詳細はこちらのページにあります。TwitterのデータをExploratoryを使って取得し、その後の簡単な分析の例を紹介した録画も同じページから見れるようになっています。
データサイエンス・ブートキャンプ・トレーニング #25
「データサイエンス・ブートキャンプ第24回」は来週の開催となり、受付はすでに終わっておりますが、次回来年2月に開催の「データサイエンス・ブートキャンプ第25回」の方はすでに受付を開始しております。
データリテラシーを高めたい、またはデータサイエンス、統計の手法、データ分析を1から体系的に学び、ビジネスの現場で使える実践的なスキルをつけたいという方は、ぜひこの機会に参加をご検討ください!
日時: 2022/2/15(火), 16(水), 17(木)
講師:西田勘一郎
データサイエンス勉強会 #21
いよいよ来週の金曜日の11月12日に「Exploratoryデータサイエンス勉強会 #21」を開催します!
今回も4人のExploratoryユーザーの方たちに、現場でのデータに関する取り組みやデータ分析のリアルの話を共有していただく予定です!
私の方からもExploratoryの時期リリースであるv6.8の紹介をさせていただきます。
お時間の都合のつく方は、以下の詳細ページより参加をお申し込みの上ご参加下さい!
今週は以上です。
西田, Exploratory/CEO
KanAugust