<“Google Cloud”TOPPAN社内セミナー>【前編】 Google Cloud活用事例/クラウド環境で求められるデータ&MLエンジニアのスキルとは
2022年7月11日、グーグル合同会社全面協力のもと、TOPPAN社内セミナーが開催された。
「クラウド環境におけるデータ・機械学習エンジニア人材について」と題したトークセッションには、グーグル社にてGoogle Cloudチームにおける開発者支援などを手掛ける佐藤一憲氏と、TOPPAN デジタルマーケティングセンター所属の西川賢大、梶原康至が登壇。
本セッションでは、Google社が提供するクラウドコンピューティングサービス「Google Cloud」を導入、活用しているTOPPANが、どのようにデジタルマーケティングの分野で活用し、成果を出しているのかの事例を紹介。そして、それらに関わるエンジニアには、どのようなスキルが期待されるのかが紹介された。
※所属企業名・部署名は2022年7月時点
登壇スピーカー: Google合同会社 デベロッパーアドボケイト 佐藤一憲氏 TOPPAN株式会社 情報コミュニケーション事業本部 マーケティング事業部 デジタルマーケティングセンター データ&テクノロジー本部 マーケティングテクノロジー部 1T 西川賢大 TOPPAN株式会社 情報コミュニケーション事業本部 マーケティング事業部 デジタルマーケティングセンター コミュニケーションデザイン本部 インタラクティブ2部 2T 梶原康至 |
■TOPPANにおけるGoogle Cloud活用・業務効率化事例
冒頭、TOPPANのデータエンジニアと機械学習を扱うMLエンジニアが現状、デジタルマーケティングセンターでどのような業務にGoogle Cloudを活用し、業務効率化が図られているのかが紹介された。
TOPPAN デジタルマーケティングセンターでは、クライアントに対しさまざまなサービス提供・業務を行っているが、案件拡大と共に業務負荷が高まり、業務効率化が重要な課題となっている。そこでGoogle Cloudを用いることで、業務効率化を目指す取り組みが推進されている。ここでは、Web広告運用業務とDM送付における、機械学習による分析業務の2つの事例を紹介する。
●事例1「Web広告運用業務~Google Cloudを活用したWeb広告レポートの自動化」
1つ目として、Web広告レポートをクライアントに送る業務を自動化した事例を、トTOPPAN 西川が紹介した。
従前は、運用担当者が手動でExcel形式によるデータ取得を行っていた。一施策あたり毎週4~5ファイルから、全部で数万行のデータを集計加工し、レポートを作成する必要があり、Excelでは都度時間がかかる状況だった。また、属人化やヒューマンエラーの課題もあった。
そこでTOPPANは、Google Cloudによる自動化の仕組みを構築する。
まず週次で取得していたデータを日次で自動出力し、Google AppScriptを用いてデータ統合、エラー検知などの処理を作成。
集計処理では、Google BigQuery(以下、BigQuery)を活用し、前述のGoogle AppScriptとBigQueryで出力したデータの集計処理を行っている。
最後にBigQueryで集計した結果をCSVファイルとして、Google Cloud Storageへ出力。広告の運用担当者が取得できる仕組みとなっている。
これにより、レポート作成者は毎週ファイルをダウンロードするといった手動処理の作業が不要となり、CSVファイルを取得後、最終的にExcel形式に整えるのみの作業となり、業務効率化が実現した。
導入効果としては、1クライアントあたり13.5時間ほどの削減成果が得られた。さらに計算の処理自動化により、属人化の防止とミスの削減にもつながっている。
●事例2「DM送付業務~効率化のための機械学習を用いた分析業務におけるGoogle Cloud活用」
2つめの事例は、DM送付の機械学習分析業務にGoogle Cloudを活用、効率化したケース。TOPPANの梶原が紹介した。
TOPPAN デジタルマーケティングセンターでは、DMやメールを送付する際、機械学習を行った上で、反応してくれそうなお客様を見つけ出し、そのお客様宛に送付。効果検証まで行うサービスを提供している。
そのサービス運用時の課題として、
・既存の機械学習ツールが月額利用のために過剰なコスト発生する
・オンプレミス環境に保存しているため容量制限がある
・オンプレとクラウドが混在しているためデータ移動に手間がかかり、ミスが起こりやすい
といった悩みを抱えていた。
それらの課題を解決するため、TOPPANはGoogle Cloudを機械学習基盤として活用した。
データの流れとしては、まずお客様から受領したデータをクラウドストレージに格納し、処理を行った上でBigQueryに格納。
SQLやGUIのツールを用いて機械学習用のデータを作成し、VertexAIでモデリング・予測を行った上で、最終的な予測リストをクラウドストレージに保存するという仕組みに変えた。
ここでのポイントとして、機械学習のツールを外部ツールからVertex AIに変えたことで、より精度が高いモデルができるようになった点、さらにモデル構築のための作業全般の負荷が軽減された点が挙げられる。
導入効果として、外部ツールからVertex AIに変えたことで大幅なコスト削減が実現。さらに稼働時間は80時間から60時間と、4分の1程度削減された。またストレージ容量制限がなくなり、Google Cloudで一本化したため、データの移動も不要となった。
加えて、これまで利用していた外部サービスは規定のアルゴリズムしか使えないなどの制約があったが、Vertex AIではさまざまなモデルやAPIが使えるなど、今後の拡張性も期待ができる。
この導入効果を受けて梶原は「ただ便利になっただけでなく、顧客に合わせてどのようなモデルが最適なのかなどを考えるきっかけにもなった。」「クラウドサービスを活用することで、業務効率化やサービス開発環境を改善できる可能性がある一方、会社全体に広めるためにはデータエンジニアやMLエンジニアなど、クラウドサービスを扱える人財を増やしていく必要性がある」と述べた。
■データエンジニア・MLエンジニアに求められるスキルとは?
では、今後増やしていくべきデータエンジニア・MLエンジニアに求められるスキルは何か。TOPPAN 西川と梶原が、現場経験から求められるスキルについて紹介した。
●データエンジニアに期待するスキル
TOPPAN 西川は、データエンジニアに期待するスキルとして、データベースとSQLの基礎知識を挙げた。現状、Excelを使った手作業でしのいでいる現場が多いとし、「最低限のSQLの知識があればパズルのように理解につながっていく」と説明。大量データともなればその必要性はさらに増す。
また、データ収集できても正しく扱えなければ意味がない。文字列と数字の判別や、数字に見えてもフラグ情報の場合もあるため、適切な処理を行うために、データの中身の理解も必要だと述べた。
これに対しGoogle 佐藤氏は同感し、「SQLと聞くとエンジニア向け言語のイメージありますが、実はGoogle社内では非エンジニアが積極的にSQLを使っています。そういうお客様が、国内でもたくさん増えつつあります」と述べた。
●MLエンジニアに期待するスキル
続いてTOPPAN梶原は、MLエンジニアに期待するスキルとして、基本的なMLの知識を挙げ、「とっつきにくいことからトライする人が少ないのが現状」と語る。さらに、「業務ではクライアントの課題やデータ形式に応じたモデルを設計する必要がある。TOPPANでは定期的に課題のヒアリングを行うなど顧客を知ろうとする意識が高く、その意識はMLエンジニアにとって、とても重要であると考えている。」と述べた。
これに対しGoogle 佐藤氏は「クライアント課題やデータ形式に応じたモデル設計については難しい課題であり、業界には対応できる人材が少ない」と指摘する。
そして佐藤氏は、TOPPANに対し抱く印象として「TOPPANは業界の中でもAI能力が非常に高いと思います。ぜひ御社の強みである、お客様の要件を理解しモデル設計を行うような、機械学習を用いる案件を増やすことが効果的と感じました」と述べた。
2023.11.30