見出し画像

【スキル拡張への挑戦①】若手データサイエンティストがIaCはじめました。

複数の専門領域をもつ“ブリッジ人材”が活躍するNRIデジタル。こうした人材の育成は、日々の活動の中でも行われています。その一例として、若手データサイエンティストがIaC(Infrastructure as Code:ITインフラをコードベースで管理するアプローチ)を用いたシステム構築のスキル習得にチャレンジし始めました。どのようにシステムエンジニアと協力し、IaCを用いたシステム構築のスキル習得を目指しているのか。その取り組みの実態を連載で紹介します。
(執筆:クラウドアーキテクト 荒井 良祐、AIビジネスイノベーション 菅 貴博、中谷 透大)

1.背景
NRIデジタルのデータサイエンティストは、データ分析に必要な確率・統計、機械学習、数理最適化などのAI領域を専門としています。しかし、実際のプロジェクトでは、これらの専門性を活かした仮説検証の円滑な推進のため、クラウドを活用したシステム構築のスキルも要求されるようになりました。例えば、分析するためのデータを集めるシステム、集めたデータを分析するためのシステム、分析した結果を共有するためのシステムなどです。

従来は、業務要件を把握しているデータサイエンティストが、毎回システムエンジニアにシステム構築を依頼してきました。しかし、システム構築経験が少ない若手データサイエンティストの場合、システムエンジニアとのコミュニケーションコストが増え、俊敏性に欠けます。そのため、業務要件を把握したデータサイエンティストが、自ら必要なシステムを構築できる力を身につけられれば、円滑にプロジェクトが進みます。そこで、実際にチャレンジすることにしました。

2.取り組みの内容
 取り組みの全体像は下記の通りです。以降で、図中①~③の流れを説明します。
 

図1:活動の全体像

①   ソリューションマップの作成
クラウド、その中でも特に進化の速いデータエンジニアリング系の技術の世界で、どこをターゲットにしていくのかを可視化するために、ソリューションマップを作成しています。各自がプロジェクトで関わったソリューションや、セミナーに参加する中で知ったサービスをマッピングして、1カ月おきに最新化して進めています。この活動は、データサイエンティストとシステムエンジニアが一緒に取り組んでいます。できたソリューションマップは、データ利活用促進に関連するソリューションの全体感を把握し、現在の取り組みの位置づけを把握するのに役立てています。

図2:ソリューションマップ

データサイエンティストが得意とする領域は、「黄色・緑色」の範囲です。
今回の活動では、この領域を「赤色・青色」にも拡大していくことを目指します。

②   演習課題の作成
全部を一度に習熟することは難しいため、日々少しずつ習熟するために、ソリューションマップを領域毎に分解(ソリューションマップの色が領域)して、演習で作成するシステム構成を検討していきます。そのシステム構成を、さらに要素に分解して小さなモジュール化し、各回の演習題材として落とし込んでいきます。システムエンジニアの方で実装、動作確認をした上で、演習課題としてGitで共有しています。
まずは、上記のソリューションマップの赤色をターゲットにして進めています。例として、下記に赤色領域を簡単なシステム構成に落とした図を記載します。この構成をさらに分解して、個々の演習課題を作成しています。

図3:基本的なWebAPI構成

③   演習実施
データサイエンティストは、時間があるときにGitを参照して課題に取り組みます。各回は小さなモジュールを開発する形になっており、無理なく取り組むことができます。また、演習課題の中の不明点は、社内のチャットツールを利用し、システムエンジニアに気軽にどんどん質問します。システムエンジニアは、何を聞かれても怒りません。回答するだけでなく、必要に応じて、参考図書や社内外の研修やセミナーの情報を展開しています。

図4:演習の1例

3. 現状の成果と今後の流れ
現状は、基本的なWebAPI構成(GKEとPythonのAPIとその周辺)をTerraformで構築できることを目指して、進めています。予定では、50個ほどの演習で構成される仕組みになりますが、現在は30個の演習を終えるところまで進んでいます。この夏にかけて完成に向かう見込みです。その後は、データエンジニアリングの仕組み(PubsubやKafka、Apache BeamやSparkとその周辺)を題材にして同じように進めていく予定です。
また、今回はクラウドとしてGoogle Cloudを利用していますが、副次的な効果としてクラウド関連の認定資格の取得にも役立っています。開始2カ月、参加者の合算で、合計8個取得することができています。
 
4.おわりに
今回は、NRIデジタルのデータサイエンティストがIaCを用いたシステム構築のスキル習得にチャレンジをしている様子をお届けしました。次回は、実際に演習を行った成果や感想、改善点などを、参加したデータサイエンティストが中心となってお伝えします。お楽しみに!