LISTEN

世の中の興味深いマーケティング事例や大きな数字、意外な事実など、経営者 榊原直也 のアンテナに留まったビジネス話題をご紹介する『ばらさんのBusiness Talk | バラトーク』。

今回のテーマは、データ分析の周辺にある課題。経営成果に繋げ、数値の危険性を回避するには何が大事なのか。また、ビッグデータ時代へと進む中で、SQL言語というツールの価値や位置づけについてもお伝えします。

 

◇ 出演者 榊原直也 / 曽志崎寛人

◇ ゲスト 廣部祐樹さん / 西潤史郎さん 

提供 : データ・サイエンティスト株式会社 
https://kwtool.co/company.html

  • データ分析で経営成果を生むには目標の共有が必須
  • 確率は嘘?数値に抱く直感と実態の危険な乖離
  • 「ギャンブラーの誤謬」克服には教育が肝心
  • SQLがデータ分析の共通言語として将来性のある理由
  • ビッグデータ時代に価値を増すSQLへの回帰
  • プログラミング学習で大切なのは、まず思考の習得

データ分析で経営成果を生むには目標の共有が必須

榊原:組織の中で働いている分析担当者から「うちの会社はいくら言ってもわからない」といった愚痴のような発言を聞くことがあります。でも、分析担当者がいかにうまく反論するかというのは、責務として大事な気がします。

広辺:そうですね。データサイエンスやデータ分析では、やっぱりそこは最終的にみんなが課題に思っています。経営者の思いと分析者が持ってきたデータが全然噛み合っていない。そういうところが大きな壁だと思っています。

そもそもデータ分析する人と意思決定する人は絶対に分けないといけない。思考バイアスがある人が自分でデータを持ってくると偏ってしまうので。第三者的に判断して、データ分析すべきです。

となると、意思決定する人と分析する人は別なので、両者の間でどれだけちゃんと意思疎通できるか、共有の目的に向かっていけるか、が問題となる。

経営者が目的とする方向をデータ分析者が意識できていないと、経営ビジョンとは合わないデータを持ってきてしまう。当然、いくら説明しても経営者には響かないという結果になります。

例えば、「なんでも鑑定団」というテレビ番組があります。素人には全然わからないんですが、骨董品の価値をその道のプロが判別して値段をつけている。それは業界の知識や長年の経験がないとできないわけです。

同様に、業界に対する価値などを知らない科学者だけでは、データサイエンスができない。分析システムを作ったりビッグデータを処理したりする必要がある。スモールデータと比べるとビッグデータはとても難しく、必要な統計学の知識の範囲は広すぎます。

でも、それができないと、データを使って価値を生み出していくという、社会的な課題を解決するところまで到達できないんです。結論として、それをやるには一人では無理です。ですから、統計や機械学習、システムなどそれぞれに詳しい人が加わって、チームとしてやっていくことになります。

そして、それぞれが何のためにこれをやっているのか分かってないと、経営に生かせません。意思決定者に役立つものを生み、AIの利用で効率化するなどして最終的な成果物を出す。それが価値あるものとなるかどうかは、チーム全体としての目標に向かっているかがとても大事な要素です。

 

確率は嘘?数値に抱く直感と実態の危険な乖離

広辺:懸念がある点として、データ共有した時に、数値が持つイメージと直感が実際からかけ離れるということは多々あります。

ギャンブルなどに使われる「期待値」という言葉、これも実は危険です。例を挙げると、1%の確率で当たりが入っているくじ、これを100回引いた時、期待値は当然1になります。ただそれを100人がやった時に、当たりを一つも引けない人は、36、37人ぐらいいます。期待値は1のはずなのに、3分の1以上の人は当たりを一つも引けないということになってしまうんですね。

実は経営的判断をする時にも、「期待値が1」というところだけを見ると危険です。期待値1という条件が裏に持つ意味というのを、分析者の方は提示しないといけません。逆に分析者の方からデータが断片的に与えられた時は、経営者側は裏にあるリスクを読みとかないといけません。

両者のコミュニケーションには、結構シビアな問題が含まれているのではないかと思います。

榊原:確かに。

西:ガチャの問題とか。

広辺:あー。ガチャとかでもそうですよね。

西:最近ネットゲームなどがなぜ流行るかというのを、ゲーム業界では研究したようです。ガチャでは、ある一定の確率で良いものが当たる。カードゲームで言うと強いカードを引くともらえるけど、外れもある。

その強いカードを引くために、お金をつぎこんでいくプレイヤーさんもたくさんいる。多くのお金を払ったにもかかわらず、全然自分は強いのが当たらない、というユーザーさんもいるわけです。

広辺:この確率は嘘じゃないか、という人がいそうですよね。確率は本当だけど、期待値の直感と実際の確率で起こる現象が違う、という乖離があるので。

西:ユーザーさんにとっては、強いカードが全然来ないという状況は、とても不満に思われそうですよね。

榊原:不満に思う人たちは、どういうインターフェースで情報提供を受ければ、これはイカサマじゃなく、自分はその運命に飲み込まれただけなんだと思えるんでしょうね。

広辺:個人的には利用する人のリテラシーだと思います。その人自身がこの1%という意味がなんなのかというのを考えて、その上で投資する価値を判断しないといけないのではないでしょうか。

 

「ギャンブラーの誤謬」克服には教育が肝心

西:データ分析は、既に高校の教科書に入っているようです。今後データを活用する時代となるにあたって、騙されないための知識を持っておこう、というのが主旨のようです。

データで分かることや判断できるリスクなどを基礎知識として、教養レベルで持っておこう、と。これからは教育でリスク管理を身につけておかなければ、という時代になってきたという感じです。

広辺:そもそも人間の本能がデータに騙されるようになっています。例えば「ギャンブラーの誤謬」という話があります。赤と黒があるルーレットで、黒が6回連続出た場合、その次は大抵の人が赤にかけちゃうんですね。けれど、実際は赤が出るのか黒が出るのかというと…。

榊原:確率は変わらないですよね。

広辺:変わらないんです。本来は関係ないはずの過去の過程というものを、連続していると脳が勘違いしてしまう。そこはなかなか難しい。脳が騙されるところを、どのように学習で克服するか、というのが問題です。

榊原:ただこの問題は国の教育目標にちゃんと入れるべきだと僕は思うんですよ。人間の直感的な期待値と実態はズレるものだという経験を、教育課程でさせるべきです。こんなに乖離することもあるということを全員が痛感した状態で社会へ出て行く。

例えば高校などで模擬投票をやってみたらいいと思うんです。黒川さんと白川さんという候補者がいるという設定で、人物の背景を明かさないまま投票を行う。7割の人が白川さんに投票したとして、それは名前に感じた単なる印象による結果ですよね。その後で人物の経歴などを明かし、直感と実態との大きな乖離を痛感させる。

ところが、こういった目標を今の教育現場は持っていない。これをスルーして大人になるのは、問題だと思います。

西:そこは、まさにデータによる判断の価値あるところですよね。

榊原:そうですね。ファクトに基づいて判断、意思決定しましょう、ということを、大人になってから理解するのは難しい。自分の判断に謙虚になるというプロセスは、絶対学生時代に必要なことのような気がしますね。

西:なるほど。

榊原:難しい統計の方程式や公式を覚えさせる前に、自分の直感が間違えることがあるんだという経験が必要です。その経験があって初めて「統計を学びたい」「もっと知りたい」「客観的に判断したい」という知的欲求が生まれるんだと思うんです。

 

SQLがデータ分析の共通言語として将来性のある理由

榊原:今回西さんの著作では分析担当者とエンジニアさんとの共通言語としてSQLはどうかという提案をされています。SQLは非エンジニアさんとエンジニアさんにとって英語のような共通言語だとおっしゃっているわけじゃないですか。

西:そういう可能性がある言語としてはSQLが最適かなと思っています。例えば日本人が東南アジアで現地の言葉しかわからない人とコミュニケーションするのは大変です。でも、お互いにちょっと英語が分かっていると片言でも意思疎通ができます。共通言語があることによって「そういうことか」と分かるわけです。

いろいろなコンピューター言語がある中でも、SQLは比較的とっつきやすい言語です。エンジニアでない方も、エクセルでベーシックや関数を使うことがあると思います。そういった感覚で使えるレベルの簡潔な言語です。

当然エンジニアもシステムの中で使うので知っている。お互いにSQLを知っていると、分析担当者側も裏側の動きが想像つき、何ができて何ができないのかという判断が簡単にできます。

また、SQLをしっかり使えるのであれば、自分でいくらでも生のデータが取れる。ハードウェア的な制約に関係なく自分で分析できるようになるというのがかなり大きいことだと思いますね。

榊原:SQLが共通言語として優れている理由は、どういうところにあるんですか?

西:基本的なことに関してはかなり簡潔に書けるということと、標準規格であることです。

榊原:企業の立場からすると、すぐに廃れてしまうような言語はやりづらい。標準規格というのは、今後もしばらく有望なものであり続けるであろう、という意味ですか。

西:SQLはもともとシステムの中で動いてきた言語で、歴史があります。データを処理するための言語として、整合性を取りながら結果を返すところに特徴がありました。現在では、言語を使ってデータ分析をする時代になってきました。そういったニーズに応える形で、SQL自体が進化してきたところがあります。

ですが、歴史の長い言語であるSQLは、標準規格としてISOが決まっているんです。各データベースベンダーは基本的にその規格に則った形で作っています。共通の標準規格を学ぶことで、いろいろなデータベースが出てきても対応できるという点で有利なのでは、と思います。

 

ビッグデータ時代に価値を増すSQLへの回帰

榊原:ビッグデータ時代に入り脱SQLが進むかと思いきや、SQLへの回帰が始まっているのも、そういう利便性によるものですか。

西:そうですね。まさにNoSQLという名のデータベースが出てきたんです。もともと企業で使っていたリレーショナルデータベースの特性を持っていないデータベースです。SQLではなく、例えばキーバリュー型とかいろいろあるんですけども。

例えばGoogleとかAmazonとかが大量のデータを分析したい場合に使えるよう現実的に数分で処理させるようなシステムを作った。データベースを作ったことで、ビッグデータ分析が可能になったんです。

ただ現場としては、専用の関数や言語、APIを勉強するより、SQLで同じことができればいいのに、ということがありました。

結果的に、ビックデータ処理用のデータベースが、SQLで問い合わせできるように対応してきている。NoSQLという名前のデータベースなのに、結局SQLに対応してきているという、ちょっと面白いことになっています。

曽志崎:データが膨大にどんどん膨れ上がっても、それを処理するのはシンプルなSQLでよいというところに、効率の良さがあります。

西:データを処理するための言語としてはSQLのほかにもありますが、結局いろんなデータベースがSQLに対応してきています。SQLを勉強しておけば、いろんなデータベースが自分で触れるようになります。

榊原:今後企業において、NoSQLとSQLはどんなふうに使い分けられていくと見ていますか?

西:SQLを使っていた従来の、MySQL、Oracleといったシステムは、例えばAmazonで買い物をしたといった時にお客さんがお金を払って実際それが銀行から引き落とされて、一連の処理が完了してから確定される。そういう処理は従来のデータベースが得意とすることです。そういったシステムはなくならないので、今後も絶対あります。

一方で分析用のシステムというのは、「データを見たい」「データ集計してこれと組み合わせたい」そういったことを繰り返し変えながらやりたい場合に使われる。ビッグデータを処理するためのNoSQLと従来のECサイトとかで使われるシステムとは別物なので、それぞれ使われることになります。

榊原:結局、SQLへの回帰が起きていると。

西:ここにきて新しい使い方が出てきているので、古いけど新しく学ぶ価値のある技術じゃないかなと思います。

 

プログラミング学習で大切なのは、まず思考の習得

曽志崎:近年、初等教育でのプログラミングという話題はよく聞こえてくるところです。

一方ここまでのお話を聞いていると、全然プログラミングできない方がエンジニアさんとの距離を縮めるために学び理解するものとしては、プログラミングよりも実はSQLの方がとっつきやすそうな感じです。

広辺さんはプログラミング教室の活動もされています。教える内容としてどちらが先なのか、またプログラミングの中におけるSQLの位置付けを、どういうふうに見ていらっしゃいますか?

広辺:個人的にはプログラミングはあくまで目的ではなくツールです。プログラミング教室で教えることも「ゲームを作りたい」「基幹システムを作りたい」という目的によってツールや言語が異なってきます。

本来はこの目的を第一にすべきじゃないのかなと思います。プログラミング言語が先行するのではなく、ある問題に対し解決するための手段の選択肢の一つとして、SQLやほかのプログラミング言語がある。

そういう形に持っていかないと、目的と手段が逆転してしまうという危険性があると思いますね。

西:プログラミング言語の学習に関しては、特にそういう思考を身につけるのが大事です。例えば、繰り返しと分岐を組み合わせたらこんなにいろいろなことができる。変数という箱を使ったらこんなに便利である。

そういった思考を身につけることによって、世の中のWEBサイトがなぜこんな動きをするのかが理解できるようになります。

ただ小学生に関しては、PythonとかJavaScriptといったプログラミング言語を使うのが良いのかなという気がします。SQLは、プログラムを組み立てるための言語ではなく、こういうデータが欲しいと問い合わせするための言語なので。目的は全然違います。

プログラミング思考を身につけることと、実際データを取りにいくために便利なことは、別に考えてもいいのかなと思います。

曽志崎:目的によってプログラミング言語を使いこなし、一方でその先に扱いたいデータがある。そういったデータ構造への理解があって初めて目的も明確にされ得るのかなと、お話を聞いていて思いました。

ばらさんのビジネストーク!

ばらさんのビジネストーク!

すぐ役立ちそうなビジネス話題が満載!構想時、企画時、朝礼時、会議時、交渉時、議論時、研修時、講演時、接待時、プレゼン時などのネタ増強にご活用ください。

https://kwtool.co/company.html

この番組のパーソナリティ

榊原直也

榊原直也

データ・サイエンティスト株式会社 代表取締役社長

Webメディアと検索順位との関係を数学的に解き明かす技術で複数の特許を持つ。その技術を駆使したサイト診断サービスは、その効果が口コミで広がり、いまや著名企業が何ヶ月も待つほどの人気サービスに。プライベートでは、難しい分野でもわかりやすく楽しい雑談ネタにしてしまう「バラトーク」が、学生、主婦、ビジネスマン、経営者など幅広い層に大人気。モットーは「楽しく!わかりやすく!」。

New Episodes

すべてのエピソードを見る

Pickup Episodes

Other Channels

propo.fmロゴ

PROPO.FM は、人々の心に残るポッドキャストを世の中に届けるサービスです。ビジネスからアートまで、声の力を探求し、驚き・感動・優しさを紡ぎ、時間と空間を越えて、社会に新しいつながりを広げます。

新着エピソードをお知らせ

PROPOが配信する、最新やおすすめのエピソードをまとめてお届けします。