Research Engineer - Post-training & Alignment / 事後学習
株式会社Third Intelligence
- C++
- Python
- CUDA
- LLM
- プロダクト開発
- PyTorch
- 大規模言語モデル
- NLP
- ASIC
- 安全性
Third Intelligenceは、日本発のAGIの確立に挑戦する、AI研究・プロダクト開発企業です。Third Intelligenceが独自に提唱する「遍在型AGI(汎用人工知能)」の確立と個人に寄り添ったその成長を通じて、社会の新たな基盤となるサービスの実現を目指します。 Third Intelligenceについて(https://speakerdeck.com/thirdintelligence/third-intelligence-company-deck) 仕事内容 ポジションの意義・背景 事前学習を終えた基盤モデルを、実際に人間が使える知能へと仕上げる役割です。具体的には、SFT(教師あり微調整)やRLHF(人間のフィードバックからの強化学習)などの手法を用いて、モデルの応答品質、推論能力、安全性を高めます。プロダクトとしてのAIの価値を直接左右する重要な工程を担っていただきます。 業務内容・期待成果 SFT, RLHF, DPO等の手法を用いた、モデルの応答性能と推論能力の高度化 特定タスク(会話、プログラミング、数学、論理推論等)における思考プロセスの最適化と精度向上 ハルシネーションの抑制や安全性確保のための学習手法、および独自の評価メトリクスの設計 高品質な合成データの生成・選別パイプラインの構築と、データ効率の最大化
-
11名〜100名
-
企業ページ