データサイエンティスト
白石 卓也

未知を既知に変換するフロントラインで「生きたデータ」を見つけ出す

Oct 13, 2023

エンジニアリングの世界において、ロボット工学からデータ分析へと自らの専門領域を拡張するデータサイエンティスト・白石卓也。打率3割とされるデータ分析の作業において、「探した先に宝がない、と明示することもまた重要」と話す。一方で美しい筋道が得られた際には「代え難い満足感」があると続け、公私の垣根を設けずに働ける環境としてこの場を選んだという。

株式会社ナビプラス ビジネスインテリジェンスグループ データサイエンティスト
白石 卓也

新卒で国内SIerへ入社し、主にシステム開発を経験。その後、デジタルガレージグループのナビプラスへ入社。DevOpsエンジニアを経て、現在はデータ分析を行うチームのマネージャーを担当している。

未知の技術を現実社会に実装する

機械工学系の高等専門学校を経て大学、大学院を卒業後、新卒でSIerへ入社し、キャリアをスタートしました。まずはソフトウェアエンジニアとして実力をつけることができる環境に身を置くという考えのもと選択した進路です。その後、2015年前後からインターネット業界を筆頭にAIやデータ分析、ビッグデータへの注目が高まるのと前後して、関連する新規事業の立ち上げに参画。「手元にある休眠データを有効活用したい」というざっくりとしたご要望をクライアントの方々から多くいただき、具体的な活用先や課題などを導き出す伴走事業を始めました。

技術にあまり興味がない方からすると、AIやデータ分析は魔法のツールのような不思議さを感じられるかもしれません。私は、まさにその「びっくりするようなものを作りたい」という思いを幼少期から抱いて育ちました。モノづくりを学んだ高専時代にはロボット工学などを通してハードウェアの学習に熱心に打ち込む一方で、プログラミングによるソフトウェア開発における即時性、たとえば自分の思い描いた操作がリアルタイムで実現できることに喜びを覚えました。大学、大学院時代には、ソフトウェアに主軸を移し、画像処理やセンシング技術の分野を研究しました。

現実社会や企業が、アカデミアの現場に追いつくまでには時間がかかるため、学生時代の自分にとって、学舎で得た知識が社会ですぐに役立つ場面があるかは想像できませんでした。けれども「いつか学んだ知識や領域で仕事を展開していきたい」と考えていたことから、関連事業の立ち上げのチャンスを得られたことはたいへん光栄なことでした。しかし大きな組織や多くの人が複雑に関わるプロジェクトを進めていく中で、制約の多さや自由度の低さを徐々に感じ、転職を決めました。

デジタルガレージグループのナビプラスに入社する決め手となったのは、しがらみがなく、自分が描いたアイディアを提案し受け入れられる、自由に動ける環境です。「ありきたりなものよりもみんなが知らない技術を役立てるような形にして面白いものを作りたい」という考えを根幹にもつ自分にとって、しっくりとくるキャリアパスでした。

カオスの中に、答えなき道筋を見出す満足感

入社後は、データ分析における専門チームの初期メンバーとして立ち上げに関わり、現在はそのチームのマネージャーを務めています。私たちのチームは大きくふたつの業務に分かれます。ひとつは、チーム主導で各プロジェクトへ貢献可能なデータ分析の知見を提案すること。もうひとつは、社内やDGグループ内のプロジェクトチームから具体的な相談を受けて課題解決やデータ分析を推進していくことです。チーム発足の背景に、グループ会社からデータ分析に対する需要が高まったことがあるため、知見を活かした提案や関わりは歓迎される環境にあります。

印象深い案件のひとつに、「大村湾データコンソーシアム」があります。長崎県大村市、デジタルガレージを含む複数の民間事業者とともにコンソーシアムを設立し、民間企業が持つ人流解析と購買分析データ、大村市の行政データ、さらに、長崎県が検討を進める観光型Maasデータを連携させることで新たなデータプラットフォームの構築を目指しました。

案件において私たちは、県外からの来訪者の動きを可視化し、そのデータから読み取れる結果をもとに近隣スポットのレコメンドを行うための人流解析を実施。どんなルートで移動するのか、どこに滞在するのかなどの情報をGPSなどのデータから導き出しました。肝となるのは、与えられたデータを有効に活用できるよう整備していった点です。たとえば、GPSデータは位置情報が常に正しいわけではなく、有効なデータになり得ない異常値を取り除くためのロジックを組む必要があります。他のデータに関しても、命題に対する適切なデータ自体が存在しないこともありますし、データが歯抜けになっていることもあります。本案件に関しても同様のことが発生し、データの使用可不可を判別した上で、最終的に人の位置を点ではなく、メッシュで分けた地図上の一区画単位で動きを追尾可能な形式に落とし込みました。

データ分析の花形は難しいロジックを組んだりAIを適用させたりというところですが、そこに至るまでのデータの前処理がポイントとなる仕事だと改めて思います。一見まとまりがなく、何も規則性が見出せないように見える素材を、どのように「生きたデータ」に変換するのか。いろいろと考え尽くし、「これならば」という一本の道筋を見出していく。非常に泥臭い仕事ではありますが、なんとか形になったときの満足感とも解放感とも言える実感は替えが利きません。

そもそも、データ分析における打率は3割程度だと私は考えています。残り7割は、先述の通り、データの不備や不測、分析の結果として役立つデータが得られない、分析の途中に案件の方向性が変わり不要になるなどさまざまなことから完了しないことが多いです。そうしたことから「大村湾データコンソーシアム」は、分析の結果を然るべき形にして世の中に発表できたことからも、御の字のプロジェクトでした。

デジタルガレージは、VUCAの荒波を乗りこなす「ノアの方舟」

私たちのチームにおいて、使用ツール等については個人の判断に任せています。一人ひとりにプロジェクトの裁量を委ねていることもありますし、案件ごとに実施すべき手続きが異なることやそれぞれの得手不得手に応じて使い分けられる状態がベストだと考えています。

私は、多くの場合Pythonでプログラムを組みますが、統計的な処理を行う際にはR言語を使用することもあります。いわゆるパッケージ化されたデータ分析ソフトは使用していません。この点においては他メンバーも同様です。私たちのデータ分析チームに関していえば、作業環境は、AWSをメインに利用しており、Jupyter LabやSageMakerのような開発環境を構築して利用したり、大量のデータ処理のためにAthenaを利用したりと、作業に応じて利用するツールを選択しています。また、データの可視化のためにQuickSightやMetabaseのようなBIツールを構築して利用している場合もあります。

AWSの一部のサービスについては、チームメンバーからの提案によって最近導入したものもあります。データ分析は、処理するデータが膨大になるため作業するパソコンのスペックやパワーに依存してしまいます。そのためクラウドなどの外部処理デバイスに接続し、より大きいリソースを確保して分析するなど、効率や最適な作業環境への改善に対する意見が反映されやすい環境にあり、作業者にとってのストレス負荷は改善されやすいです。

そうしたことも関連してか、チームメンバーは自由で伸び伸びしているとよく言われます。一方で、チームメンバーに限らずデジタルガレージグループ全体に共通するのは、情報に対する感度の高さです。ここ数年だけでもIT業界の潮流はかなり変化し、技術はますます激しいスピード感で躍進や衰退をしています。その中でデジタルガレージグループは、グループ会社を横断した全体会議などにおいて、最新技術や動向などをリアルタイムで拾い上げています。2023年5月時点ですでに、既存サービスにChatGPTを活用した最新のプラグインを実装したグループ会社もありました。日本国内の中でもトップレベルのスピード感です。

VUGAと呼ばれる先行き不透明な時代においても、デジタルガレージグループであればこの荒波を乗り切れるような確信があります。企業としても常に変化していく会社ですので、それも含めて楽しめる技術者の方にとっては理想の環境かもしれません。展開するサービスも多岐に渡りますし、技術領域においてもweb3やAI、決済など複数の分野を有するグループですので、特定の領域に絞ることなく入社後に自分の興味に応じて方向転換できることも魅力のひとつです。そうした心持ちで、気軽にデジタルガレージグループについて、興味をもち、キャリアパスにおけるひとつのカードとして見ていただけたらと思います。

Read More Inteviews
more