Research Engineer
株式会社APTO
- 強化学習
- 機械学習
- Python
- データ分析
- 生成AI
- 品質管理
- LLM
- プロダクト開発
- AIエージェント
- MLOps
■ 募集背景 APTOでは、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。 近年、AIモデルの進化に伴い、競争力の源泉はモデル構造そのものから、「どのようなデータを、どのように設計し、評価し、改善し続けられるか」へと急速にシフトしています。 特に、 ・LLM / VLM / マルチモーダルモデルの高度化 ・本番運用を前提とした大規模データ要求 ・データ品質がモデル性能を直接左右する構造 が同時に進み、AI開発におけるボトルネックは完全に「データ側」に移行しています。 さらに現在は、 ・有害データの混入 ・バイアスの増幅 ・誤学習によるリスク ・評価指標と実運用性能の乖離 といった AIの安全性・信頼性に関わる課題 が顕在化しており、データ設計は単なる精度改善の問題ではなく、AIの社会実装における責任領域へと拡張しています。 APTOでは現在、 ・データ設計や評価が属人的に行われている ・モデル改善のボトルネックがデータ側にあるが体系化されていない ・安全性・品質・性能を統合した設計思想が未確立 という課題を抱えており、AIモデル性能と安全性を「データの観点から」引き上げられるResearch Engineerを募集します。 ■ このポジションの本質 AIモデルが正しく学習され、安全性・信頼性を担保し、本番環境で信頼できる性能を発揮する状態を、データ設計と評価ループの構築によって実現することを担っていただくポジションです。 扱う対象は単なる学習データではなく、 ・モデルの挙動を規定する訓練信号 ・評価基準を形作るテストデータ ・安全性を担保するガードレールデータ といった、AIのモデルの出力特性と性能を規定する要素です。 そのため本ポジションでは、 ・どのデータがモデルの意思決定に影響するのか ・どの評価が本番性能を適切に測定できるのか ・どのようなデータ設計が安全性を担保するのか といった問いに対し、研究的視点と実装視点の両方から取り組むことが求められます。 ■ 主な役割 ・LLM / VLM / マルチモーダルモデル向けの学習データ設計 ・データ前処理・アノテーション方針の設計と改善 ・モデル評価指標の設計および評価結果の分析 ・学習 → 評価 → データ改善 のフィードバックループ構築 ・モデル開発チームとの連携による性能改善 ・データ品質・バイアス・安全性に関する設計指針の確立 ■ 研究テーマとしての領域 本ポジションでは、以下のような研究的テーマに取り組んでいただく想定です。 データ設計領域 ・モデル性能を最大化するデータ分布設計 ・データカバレッジと一般化性能の関係 ・少量データ環境での効率的データ生成 評価領域 ・モデルの実運用性能を反映する評価指標の設計 ・評価データセットの品質設計 ・自動評価と人手評価の統合設計 AI安全性領域 ・有害出力を抑制する訓練データ設計 ・バイアス・公平性に関するデータ分析 ・安全性評価データセット(ベンチマーク)の設計 ・データガバナンス・トレーサビリティ設計 ・SFT, RLHFによるモデルの性能向上 ■ 主軸(最も期待する領域) ・AIモデル向けデータ設計・品質管理 ・モデル評価とデータ改善ループの設計 ・Pythonを用いたデータ処理・分析 ・データ視点からのモデル性能改善 ■ 扱う対象例 ・LLM / VLM 向けテキスト・画像・動画データ ・物体検知・画像認識モデル向けデータ ・アノテーションデータ・メタデータ ・安全性評価用データセット ■ このポジションで得られるもの ・AIモデル性能を左右するデータ設計の実務経験。 ・最新のLLM / VLM を実運用レベルで扱う希少な機会。 ・AIの安全性・信頼性に関わる最前線の課題に取り組む経験。 ・研究とプロダクト開発を横断したキャリア。
-
¥6,000,000 - 15,000,000
-
11 to 100