ソフトウェアエンジニア(機械学習基盤)
株式会社サイバーエージェント
- Kubernetes
- PyTorch
- Go
- TensorFlow
- MLOps
- OSS
- GPU
- HPC
- Jupyter notebook
- MPI
- kubeflow
- ML Platform
- RoCEv2
- NVIDIA H100
- RDMA
- NCCL
- Tokyo
- 1,001 to 10,000
- Company Homepage
Company Info
The data strategy department of a cyber agent analyzes and utilizes data to support business in a state where data infrastructure and various development and analysis tasks are performed. We support the growth of businesses that utilize data by implementing data infrastructure and various development and analysis tasks.Job Summary
募集ポジションでは、機械学習基盤ML Platformの開発・運用を担当します。具体的には、GPUインスタンスの払い出しや機械学習ジョブの実行、モデルのデプロイなどを行い、MLOps推進のための機能開発も予定しています。大規模なGPU Kubernetesクラスタの運用や、AI系開発支援のためのサービス開発も含まれ、社内ユーザーとのコミュニケーションを通じて、ユーザーのニーズに応えるサービスを提供することが求められます。Duties
機械学習基盤であるML Platformの開発と運用を担当し、社内のAI技術者やプロダクト開発の効率化を図ります。具体的には、大規模なGPU Kubernetesクラスタの構築・運用を行い、物理GPUノードのセットアップやKubernetesクラスタのバージョンアップデートを定期的に実施します。また、AI系の開発を支援するために、GPUインスタンスやJupyter Notebookを払い出すサービスの開発、機械学習フレームワークを用いたジョブシステムの構築、機械学習モデルのサーバーレスデプロイシステムの開発を行います。さらに、ML Platformの規模拡大に向けて新規社内ユーザーとのコミュニケーションを図り、ユーザーサポートやGPUリソースの需要調査を行い、必要に応じてリソースの増設を検討します。これらの業務を通じて、ユーザーが求めるUXや機能を備えたサービスを提供し、社内プロダクトがCycloudのML Platformを選択する理由を作ることが求められます。Login to see all information about offers.
By registering with LabBase Plus you...
- can view all offer information,
- receive notifications of new offers,
- possibly be scouted by corporations
Registration takes roughly 2 minutes