この記事の目次
データサイエンティストの定義と仕事に必要なスキル
データサイエンティストの定義について知るには、データサイエンティスト協会から情報を得るのが良いでしょう。データサイエンティスト協会では、このように謳っています。
「データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」
引用元:「データサイエンティストのためのスキルチェックリスト/タスクリスト概説」データサイエンティスト協会
はい、難しそうです。というか、激ムズです。こんな人達で溢れかえったら、ビジネス課題が撲滅しますからね。
しかしながら現実問題、ビジネス課題は山盛りです。答えを出せるほどの人材は、数的にも質的にもまだいないということでしょう。
そもそも、「データサイエンス力」や「データエンジニアリング力」って何かという所も気になります。データサイエンティストには求められるスキルが3つあります。「データサイエンス力」と「データエンジニアリング力」に加えて、「ビジネス力」です。このスキルセッチについては、次回の記事で紹介したいと思います。
上記の引用文句は、データサイエンティストの方々に向けた言葉に聞こえます。
そのため、データサイエンティストではない人達に説明する際は、もう少しだけ分かりやすく、且つ偉そうにしない言い方が良いと考えています。
少しは馴染みのある言葉になったでしょうか。まだ格好良い表現なのはご愛嬌。ポイントは、以下の4つです。
データを様々な角度から見る(データエンジニアリング力)
多角的な視点でデータを見るためには、データを自由自在に扱える必要があります。
例えば、あるデバイスに電圧を印可すると電流が流れます。デバイスの評価をする際は、電圧と電流の関係をグラフにして出しますが、本来であれば、測定器や測定時の温度・湿度、光の照度や、デバイスの傾き、もしかしたら測定した人のデータまでないと、正しい数値と言えないかもしれません。
これらを全てパラメータとして扱えることを、データサイエンティストは求められています。
データを統計的に見る(データサイエンス力)
統計学は、データサイエンティストの必須スキルでしょう。
多角的にデータを見れても、その因果関係や相関の強さを背景に説明できなければ説得力がありません。
「俺はこう思う!」「私が言うのだから正しい」と主観で話をするのではなく、「AによりBが変化する」「CとDの間には正の強い相関がある」と言った客観的な話をしなければなりません。
課題を解決に導く(ビジネス力)
データを活用して客観的データを提示し、「後はよろしく!」と言っても、誰も耳を傾けてくれません。よその人がうちの文句を言っても聞き入れたくないですよね。
データサイエンティストは、課題の当事者となる必要があります。
そのためにはプロジェクトや事業に入り込み、一時的にメンバーの一人にならなければなりません。課題を共有し、共に課題解決をおこなうのです。
人達(チームで実行する)
データサイエンティストに求められるスキルは、非常に高いレベルにあります。そのため人材が不足しており、年収も高水準に位置付けられています。
そしてこの求められるスキルを1人で習得しているスーパーマンは、そうそういるものではありません。1人で出来なくて当たり前のレベルが求められています。
だから「人達」、つまりチームでデータサイエンスを駆使するのです。
データサイエンティストが仕事をする際の弱み
さてこのデータサイエンティストですが、以下3つの弱みがあります。
1.プロジェクトや事業がないと仕事が出来ない
2.周囲の理解を得にくい
3.人間の知見を超えれない
データサイエンティストは「仕事人」です。プロジェクトや事業がなければ、データサイエンティストも必要のない存在です。そのため、プロジェクトや事業には積極的に入り込んでいく必要があります。自分も課題に対する当事者であるという意識は必ず持つようにしましょう。
部外者としてプロジェクトや事業に関わっても、理解されません。
こう思われないためにも、当事者として活動しなければなりません。
そして、機械学習を利用してアプローチしていきますが、データは人間が取得し入力をします。メンバーの中には「驚きのある結果」や「人知を超えた成果」を期待する人もいるでしょうが、結局は人が与えた範囲でしか、答えは導かれません。メンバーもデータサイエンスを駆使している当事者であるという意識を植え付けておく必要があるでしょう。
お互いに理解しあえるよう、充分なコミュニケーションを取っていきましょう。
データサイエンティストの仕事は周囲に理解されてこそ
目に見えないものを理解するのは非常に困難です。
合成クモ糸繊維の量産化に成功した、かのペガサス企業「Spiber」。創立者の講演会で聞いた話では、初めて目に見える糸を作ったのが会社設立1年後。それまでは誰もが成功は無理だと言っていたそうです。目に見えて、ようやく1割程度の人が「いけるかも」と考えるようになってくれ、融資を受けることが出来たそうです。
ソフトウェアはメカと異なり、プロセスが目に見えづらいものです。また、ソフトウェア技術の習得には時間がかかりますから、ソースコードを見せて説明しようとしても、ソフトウェアの未経験者には理解してもらえません。
データサイエンスも同じく、まだ理解していない人に理解してもらうのは非常に困難です。
私も社内でデータサイエンスを広めるべく、経営陣に理解を求めるための説明をしました。目指すところはなんとなく分かっても、具体的に何をするかが理解できないと感じたようです。恐らく簡単に理解されることはないだろうと予想していましたので、熱意を強めに伝えるようにしました。
こう考えてもらった上で、承諾をしてもらう作戦です。
これで上手くいけば良し。上手くいかなければ、会社として新しいことをするつもりはないんだと、会社に対して見切りをつけようと考えていました。
結果としては、データサイエンス普及の承諾を得ることが出来ました。
社内でデータサイエンティストが認知されていない企業、且つボトムアップで立ち上げをする際は、スタートまでのハードルが高く、スタート後も相当な苦労が待ち受けることになるかと思います。その場合、最初に必要なのは「ビジネス力」です。
認知されている企業では、「データサイエンス力」「データエンジニアリング力」があれば好スタートが切れるでしょう。
次回は、データサイエンティストに求められるスキルを更に詳しくみていきたいと思います。