データサイエンティストへの道 里 洋平さんの場合

ウェブエンジニアからデータサイエンティストへキャリアをチェンジし、Rのコミュニティーで活躍したりビッグデータやデータサイエンスの関する多数の本を出したりしている里洋平さん。どうして、どうやってデータサイエンティストという道を選び、その道へとチェンジできたのか? 里さんのキャリアパスについてなどをうかがってきました。

キャリアラボラトリー:
大学は電気電子工学科で、データサイエンティストとはまったくかけ離れていましたよね? 確か、エンジニアとしての第一歩はウェブエンジニアのはず。どうやって、今のキャリアになったのか経緯を教えてください。

DATUM STUDIO 株式会社 取締役副社長 兼CTO 里 洋平さん

DATUM STUDIO 株式会社
取締役副社長 兼CTO
里 洋平さん

里さん:
その学部でも情報系のことを研究していて、学生の頃はアルバイトやインターンでウェブエンジニアをしていました。社会人の第一歩はYahoo!JAPANで、新事業や新サービスの開発を担当していました。でも、その頃にデータマイニングに出会って面白そうだなと思って。この分野をやりたいと希望を出していました。

キャリアラボラトリー:
Yahoo!JAPANの中でデータマイニングの仕事と出会えたんですか?

里さん:
開発している分野が幅広い会社ですからね。おすすめの動画を表示するなどのレコメンドエンジンとか金融マイニングとか、本当にいろいろ。その中でRに出会って、これはRもそうだし、データマイニングも本気で深掘りしたいぞ!って思ったんです。でも、その当時はRの勉強会そのものがないんですよ。だから自分で「Tokyo.R」っていう勉強会を立ち上げました。普通、プログラムの勉強会ってエンジニアしか集まらないのですが、Tokyo.Rの場合は統計やマーケティングをする人も参加してきて、事業側の人やマーケティングリサーチャーだったり、あるいは金融系人だったり、普段だったら会わないであろう人たちと交流が持てて、視野が広がりました。

キャリアラボラトリー:
Tokyo.Rの規模はだんだんと大きくなっているようですが。
何人くらい参加されているのですか?

里さん:
月に1回は開催するようにしていて、参加希望数としては100人前後くらい。ただ、この2年間で増えてます。前後半でセッションを大きく分けて、前半が初心者セッション、後半が応用セッションにして、最後がライトニングトーク。毎回、初心者でも参加しやすいような構成にしています。

キャリアラボラトリー:
さて、里さんの視野が広がったところで、DeNAに転職されたわけですが、そこはデータ解析のチームがある部署でしたよね。

里さん:
ソーシャルゲームって、ご存知だとは思うのですが裏側でめちゃくちゃ分析かけているんですよ。たとえば、どのゲームがどれだけポテンシャルがあって、どのくらいの収益があるのかとか。あるいは、どのゲームをリコメンドするのがベストなのかとかをデータを分析してさばいています。ゲームのバランスにしてもボスの強さを上げすぎると、ユーザーのモチベーションが下がったりしますからね。データからゲームバランそを最適化するといった分析をしていました。

■■データサイエンティストになるためのキャリアを作る方法

キャリアラボラトリー:
今、データサイエンティストに興味を持っているエンジニアって多いのですが、どんなキャリアを持てばいいのですかね?

里さん:
求められるスキルは多いですね。データサイエンティストは、コードを変えてデータをまわしたり、さばいたりするスキルも必要だし、分析のスキルも必要。さらに、その効果を出すためには、ビジネスのことも知らなきゃいけない。例えば、マーケティング戦略とかコンサル系の問題発見から問題解決のスキルもかなり必要になってきます。エンジニアがデータサイエンティストを目指すなら、どこか入り口を見つけることが大切だと思います。

キャリアラボラトリー:
入門となるような求人があれば、良いのでしょうどけね。里さんの場合は、他の分野からキャリアを積み上げてデータサイエンティストになったわけですが、その場合は何を意識したら良いですか?

里さん:
統計ツールの概念や使い方をおさえることでしょうね。この手法は、結局のところ何をやっているのかを把握しておいて、それが目的にあっているのかどうか、今のデータに適用できるのかどうかを考えるようにするといいと思います。また、各手法は、何らかの仮定があるので、それもおさえた方が良いです。この手法は○○を仮定してるから、そこが成り立ってなかったら結果がおかしくなってしまうといったことを察知するスキルが重要です。

手法を知ることは情報がたくさんある中で簡単になってきています。そこから、実際に使ってみていろいろな壁にぶつかりながら、ノウハウや知識だけじゃなくて、経験を積むこと。実際にデータ解析の現場では、うまく動かなかった時にどういう工夫をするかが鍵です。実際のデータをハンドリングするとうまくいかないことの方が多いんですよ。そこをツールの組み合わせなどで切り抜けられるスキルが求められます。

■■新しいビジネスはデータ解析の自動化

キャリアラボラトリー:
DATUM STUDIOという会社のCTOになられたわけですが、早速、メディアなどでも紹介されて話題になっていますよね。このビジネスを始めたきっかけは?

里さん:
最初は、知り合いから分析の相談があって、土日や空き時間などで、ボランティアでやっていたところ、成果が出てきたので、本格的にやってほしいという声があったのがきっかけでした。また、それとは別に、データドリブンなマーケティングに関して、進んできてはいるものの、まだ課題があるなと感じていたのもあります。
例えば、マーケティングでデータを使う場合、今だとマーケッターの人が仮説を立てて、それを検証するためにクロス集計を行っています。様々な仮説があるなかで筋が良さそうなものから、それが正しいのかどうか、他の仮説と比べて良いのか悪いのかを調べるために、たくさんの時間をかけてクロス集計を行っています。
でも、これって実は、様々な仮説がある中で選ぶ時に、経験だったり直感だったりという、データドリブンじゃないところがあるなと。
これを自動化して、データから見て筋の良い仮説を抽出できれば、本当の意味でのデータドリブンなマーケティングが実現出来るんじゃないかなと考え、これを新しいビジネスとしてやっていこうと思い、起業した流れになります。
また、今話した仮説を自動で抜いてくるアルゴリズムは既に出来ていて、DATUM CROSSというサービスで提供しています。このサービスを使うと、データから筋の良い仮説を抜き出してくれるため、マーケッターは煩わしい集計作業をせずに、より深い考察をすることができ、施策の精度を高めて行く事が出来ます。

キャリアラボラトリー:
データ解析をより多くの人が使えるようになるサービスなんですね。

里さん:
仮説を立てて検証し、その結果を考察をする。この繰り返しに時間をかけられれば、最も効果の高いアウトプットを出すことができます。でも、実際には時間が無い中でできる範囲のことしかアウトプットできませんよね。これを自動化して仮説選定の効率を上げることで、考察することに時間をかけられるようになる。そうなれば、短い時間で、最も効果の高いアウトプットを出して行く事が出来るようになります。

キャリアラボラトリー:
まさに、データドリブンなマーケティングが実現出来ますね。

里さん:
DATUM CROSSに関してはコンペティションになるような製品は今のところないと思いますね。今は、一度コンサルティングという形で入って、このツールを用いた分析を行い、その後APIを利用してもらうというスタイルでやっています。将来的にはAPIを広く解放し、手軽に利用出来る状態にしたいと考えています。データ解析が世の中に広がっていくようなサービスになることを願っています。

キャリアラボラトリー:
大きな会社に成長しそうですね!期待しています。


2014-12-16 | Posted in コラムComments Closed 

関連記事