Skill
得意とする領域・技術
アナリストタイプ
機械学習技術を軸として、様々なデータの分析に取り組む。特にセンサデータの経験が豊富。
データの背景にある物理学や生物学などのメカニズムを踏まえた分析を行い、データの特徴を適切に把握することで、より効率的に、より適切なモデルの構築を行う。
学習データ量や計算リソースに制約がある場合でも、お客様の求める成果に近づくために全力を尽くす。
Achievements
主な実績
- 2019年
- 入社
- 2019年~
- 時系列データを主としたデータ活用案件の、提案、分析、開発を一貫して対応
- 主な業務実績
-
- 充電式バッテリーの寿命推定
- 生体情報の異常検知
- 生産ラインの不具合検出
- チャット等のコミュニケーションデータの分析 ul>
Style
仕事のスタイル
メカニズムをモデルに組み込む
昨年末に ChatGPT が発表されて以降、世界は空前の生成AIブームです。機械学習という技術の存在がなお一層大衆化した感がありますが、一般的にそこでイメージされる "AI" はインプットからアウトプットまでを End-to-end な深層学習モデルとして作成されたブラックボックス的なものでしょう。
文章や画像など、ウェブ上から入手可能な圧倒的な量のデータと莫大な計算コストをかけることができるならそれも選択肢には入るのかもしれませんが、お客様が実験や観測を通して計測されたデータから何かしらの知見を得ようとする取り組みにおいては、実験や観測をするにも計算資源を用意するにも人的、金銭的、時間的、物質的な制約がある場合がほとんどです。
それでは限られたデータと計算資源の中でデータ分析にどう向き合うか。私がいただくお仕事で扱うデータは、その背後に物理的なメカニズムや生物学的なメカニズムが存在するものがほとんどです。
データが表す現象の専門家であるお客様からそのメカニズムについての情報を引き出し、メカニズムとして分かっている情報を可能な限り多く数値モデルに与えることで機械学習に任せる仕事はなるべく単純なタスクに落とし込む。そのためにデータがもつ特徴を分かりやすく可視化してお客様に提示し、そのデータの挙動が持つメカニズム的な意味を知るためにお客様とのコミュニケーションを密にする。これこそが、まだ4年間と短い期間ではありますが私がデータ分析を生業としてきて、現在最も大切にしていることです。
実はこの「機械学習に任せる仕事をなるべく減らすこと」はお客様から教えていただいたことです。技術者にはありがちなのかもしれませんが、理論的/技術的に綺麗かつ高度な技術にどうしても魅力を感じてしまいます。しかし特に近年の高度な技術は豊富な計算資源を前提にしているものが多く、必ずしもお客様の需要にマッチするとは限らないのが現状です。一方でメカニズムが組み込まれたモデルは計算コストが少ないだけでなく、解釈性も高いためにどこで問題が発生しているのかを特定することも容易になります。
データの背後にある現象のメカニズムについて素早くポイントを押さえ、得られた理解を知見としてモデルに組み込む。プロジェクトごとにこの作業が必要となる限り、技術者としての生涯学習が終わることはないのだろうと感じています。