見出し画像

AIを活用したIP開発の最前線でデータサイエンティストが大切にしていること

NRI(野村総合研究所)とNRIデジタルが開発・提供している「DiPcore」。AIの先端アルゴリズムとクラウドテクノロジーを組み合わせ、Eコマースサイトや基幹業務システムに組み込むためのソフトウェア部品群です。
この「DiPcore」をはじめとしたIP開発のメンバーとして活躍しているデータサイエンティスト楊さんに、AI技術を活用したIP開発における課題や難しさを聞きました。

楊梦龍(やん・むりゅう)2019年に新卒で大手総合電機メーカーに就職し、ソフトウエアR&Dに従事。2021年からNRIに入社(NRIデジタル出向)。データサイエンティストとして流通、サービス産業向けAI技術の実用化・製品化に携わる。近頃は主に画像処理系のAIアルゴリズムを使ったシステムの研究開発に取り組む。

---現在携わっている開発プロジェクトについて教えてください

主に、「DiPcore」の「サイズスキャンIP」と「AI-OCR IP」という2つのIP開発プロジェクトに携わっています。
サイズスキャンは、1枚の画像から物体の三辺を測定する技術で、人手による測定工数を削減することで流通・配送などの効率化を目指すコア技術の一つです。
AI-OCRは、画像から伝票などの書類の文字と対応項目をセットで認識する技術で、人手による書類のデジタル化を自動的に行う技術です。
いずれも高度な画像AI技術を駆使し、従来は人が行っていた作業を自動化・デジタル化するDXプロジェクトです。

---2つのプロジェクトで、楊さんはどのような役割を担っているのでしょうか?

特にAIモデルの開発を担当しています。
サイズスキャンでは三辺の認識AIや測定アプローチを主に担当し、AI-OCRでは書類から住所・氏名など必要項目エリアの検知AIを開発・改善しています。
開発と一言で言っても、アプローチ検討・調査、データ収集・作成、モデリング・訓練、精度性能改善、デプロイを含め、チーム内で協力し合いながら、AIシステム開発関連の各工程に携わることができました。

---その役割の中で、難しさを感じた点はどのようなことですか?

最も難しいと感じたのは、実現アプローチの確立です。

主にIPの新機能開発に関わっているため、いかに今までの不可能を可能にするかが主な業務です。その実現方法を模索するなかで、問題設定と視点を変える柔軟性、アイデアを生み出す技術発想力のほか、課題分析や改善サイクルを迅速に回す開発力が強く求められます。非常に難しいですが、プロジェクトと共に成長できていることを実感しています。

AI関連業務の開始にあたって一番の課題は、やってみないと課題がわからないことだと思っています。システム開発は、要件があれば設計・課題見積もりがある程度できる一方、AI開発は実際のデータによるため不確定性が高いです。
新しい要件のフィジビリティ検証、類似要件の転用活用可否、データ量とバリエーションによる対応方針変換など、いずれも実際のデータを元に手を動かさないと、具体的な課題の洗い出しが困難です。

そのため、早期に実現可能性を提示するためのフィジビリティ検証と、よりデータバリエーションが多くなることを見込んだ精度性能検証を、導入先のお客さま企業と連携しながら、PoCサイクルを迅速に動かす必要があります。

---自分の持ち味や強みが活かされていると感じるのはどんな時ですか?

私自身は、技術への強い興味関心と、それなりの開発・実装力があると自負しています。
強い興味関心があるゆえ、技術調査の際も、趣味や娯楽のような感覚で技術・論文を見ています。そのため一見すると役立たなそうなネタでも暗黙的に蓄積していて、実際の業務課題に出会うたびにあれこれ繋いで複数のアイデアや方針を検討することができます。幅広いアイデアをスピーディーに実装検証することで適切な課題解決法を発見でき、自身の実装力も向上する。このように会社のプロジェクト開発も自身のスキルアップも良いサイクルとなっていて、恵まれた環境にいると感じています。

---具体的なエピソードがあれば聞かせてください。

例えばサイズスキャンの要件は、「画像から段ボールのサイズを知りたい」でした。
画像を入れてサイズを直接に出せるAIモデルを作れば、という直接法を考えがちですが、そんな都合がいい既存アプローチは当然まだ世の中にないですし、段ボールのバリエーションを考えるとデータ収集の工数高や訓練の不安定の面があって実現は困難です。

そこで、物体エリアの認識、物体三辺の認識、三辺から実寸の推定のようにタスクを分解することで、タスクの簡略化と既存アプローチの活用ができます。しかし、このような方針確立は、「サイズ測定」という漠然とした要件から、最初から分解するトップダウン式が難しく実現可能性も検討しにくいのです。

一方、もともとさまざまな画像分野ネタを知ったうえでサイズ測定と全く関係のない分野のアイデアを組み合わせたことで案件の切り口を見つけることができ、ある程度の実現可能性や実現方法を見据えて検証を進められました。
その結果、段ボールの測定誤差が1cm以内に収まるアプローチを導き出しました。段ボール測定を実現する過程でさらに調査を実施しネタを蓄積したことで、果物からスーツケースまで、カテゴリに頼らない非定型物体の測定アプローチも実現しました。

「DiPcore SiZESCAN」アプリ画面イメージと測定の流れ

---楊さんが今後、個人で取り組みたいことや想い・ビジョンはありますか?

NRIデジタルには「まだ見ぬ世界を切り拓こう。」というパーパスがありますが、まだ見ぬ世界は常にあり、立ち留まらず常に「切り拓く」意識が個人でも大事だと実感しています。「リスクを超えて挑戦」というバリューもあるとおり、会社も個人も安定と安全を求めることなく、常に新しいことにチャレンジし続けたいです。
「まだ見ぬ世界を切り拓こう。」を、個人にとっては習慣化、会社にとって仕組み化させるために、NRIデジタルみんなの智慧やこれまでの仕組みを参考にしたいと思っています。


おまけ:仕事では最先端技術に触れている楊さん。プライベートの楽しみは・・・

最近は、猫を飼っていて、家で猫と遊ぶことが多いです。非常に可愛いので、癒しになります。ですが、自分の部屋にケーブルや部品が多くて、猫が誤食することが悩みです。

(左)ごきげんな猫さん (右)病院で紐を吐かせた後の不機嫌猫さん


この記事が参加している募集