リクルートテクノロジーズ メンバーズブログ  リクルートテクノロジーズ 新人研修特別版(データ分析編)

リクルートテクノロジーズ 新人研修特別版(データ分析編)

婚活データマイニングガチ勢の大杉です。

今年のエンジニア採用の新人研修では、リクルート自然言語処理ハッカソンを参考に、実際のサービスのデータを分析する特別研修を3日間行いました。

データを分析をするというスキル自体は、現状把握のための強力な手法であるため、どの職種でも必要になります。

エンジニアとして採用された新人たちがデータを分析を専門にしなくても、実際のサービスを開発・運用していく中で正確な現状把握は非常に重要になるという思いから、本研修を実施しました。「正しいものを正しく作る」のがエンジニアの仕事であるため、新人たちが、何が「正しいもの」なのかを自ら考えられるエンジニアになるための一助になれば幸いです。

実際に、婚活領域でデータ活用基盤を作り、組織全体でのデータ活用を推進している横山さんの解説から研修はスタート。

当日のスライドはこちら。

その後、テーマ別にチームをわけて、新人2~4人の5チームでデータ分析に取り組みました。

テーマには、継続利用率をあげる施策の提案や、レコメンド改善などの日々のサービス改善の他に、迷惑行為の検知のほか、用途を限らないデータからの知識発見などエンジニアとしての仕事に限定することのないテーマを用いました。

分析には、Google Big Query 上にデータを蓄積したもの(実際に日々のサービス改善にも利用しています)を用いました。

コーディングに抵抗のない参加者が多かったので、Big Query へはブラウザ UI のほか、Python 3 + Pandas on Jupyter notebook でアクセスして、分析してもらいました。

コードでグラフを生成する経験が少ない人が多く、可視化にこだわる人もいました。(わかる…)

また、実際のサービスを利用しているので、「この仕様どうなってるんだろう?」「これ本当かよ?」をサービスにアクセスして利用者になった気持ちで確認できたのも良かったです。

以下、参加者の声です(原文ママ)

Pythonに不慣れだったためPython,numpy,pandasなどの扱いにつまずくことが多く、分析にあてれた時間が少なかったのが残念だった。あらかじめPython,numpy,pandasの予習をしておけばもっと充実したと思う。
全く知らない分野かつpythonも書いたことがなかったが,実践的な技術を知ることができてよかった. 趣味にも使える技術をしれてよかった。
もっと長く一週間とかとってもいいと思った。
実データに触れたデータ分析、講師・メンターからの丁寧なアドバイスで教わったことは今後の業務でも大切そうなことばかりで非常に良い経験だった
私達のグループが選んだテーマが取り組みやすいものだったのもあり、初日から成果らしいものを挙げることができ、終始楽しみながらハッカソンに取り組むことができた。 最終的には満足のいく成果物を作ることができ、データ分析への興味が強まった。
実際のデータをもとに自分なりの分析をできたことで具体的なデータ分析を学べました。ありがとうございました。
とても面白かったです。 データ分析はあまりしたことがなかったのでいい機会でした。ありがとうございます。また機会があれば是非参加したいです。
実運用されているあれ程大きなデータを自由に触ることができる機会があってとても良かった。
大杉さんが非常に親切に進捗管理とアドバイスをしてくださり、データも扱いやすいものが用意されていたので取り組みやすかった。 時間が少なかったので仕方ないが、全体の知見共有の時間があれば嬉しかった。

時間が足りないコメントが多々ありましたが、現場配属後にチャンスはいくらでもあるので大丈夫です!!

今後も、データ分析やってみよう!布教活動を続けていく予定です。

リクルートテクノロジーズでは、データ分析に限らず、多芸なエンジニア仲間を募集中です。