LabBase Plus celebrates pride
Go back to homepage

Job offer curation - ⁨Site Reliability Engineer⁩

Offers

Urgent

MLOps

日本電気株式会社

  • SRE
  • AI
  • 機械学習
  • データ分析
  • 生成AI
  • Kubernetes
  • LLM
  • PyTorch
  • TensorFlow
  • 画像認識

国内企業最大規模の580PFLOPS(FP16)のAIスーパーコンピューターの開発・運用を担当するSite Reliability Engineerとして、最新のハイエンドGPU928基を備えるAIスパコンの安定運用と基盤強化を行います。具体的には、Kubernetesを用いたコンテナオーケストレーションの実装・運用、分散システムの設計・開発、数PB規模の分散ファイルシステムの管理、システムの運用設計・監視の実施、GPU関連処理技術(CUDA、NCCL、MPI等)を活用した最適化、PyTorchやTensorFlow等の学習フレームワークの環境構築・運用を担当します。世界有数のAI研究者数百名が利用する環境を支え、NEC独自の生成AIや大規模言語モデル(LLM)、生体認証技術、画像認識、データ分析などの研究開発を技術面から支援し、AIの進化に合わせた基盤強化のためのソフトウェア開発も行います。

  • Salary ⁨¥⁩⁨9,300,000⁩ - ⁨11,000,000⁩
  • Work Location 神奈川県
  • Company employee count Over 10,000

Other offers from this company

データエンジニア

株式会社BuySell Technologies

  • AWS
  • Python
  • GCP
  • Docker
  • SQL
  • Terraform
  • Kubernetes
  • Go
  • BigQuery
  • Github Actions

データエンジニアとして、社内の多様なデータを活用するためのデータ基盤の構築・運用を担当します。大規模データのパイプライン設計、インフラ自動化、パフォーマンスチューニング、データ品質管理などを通じて、リユース事業のテクノロジー基盤を強化する重要な役割を果たします。

  • Salary ⁨¥⁩⁨6,000,000⁩ - ⁨8,000,000⁩
  • Work Location 東京都
  • Company employee count 1,001 to 10,000
  • Link to this company's homepage. Company Homepage

Other offers from this company

SREエンジニア

株式会社クラウドワークス

  • AWS
  • GitHub
  • TypeScript
  • Docker
  • Slack
  • Terraform
  • MySQL
  • Go
  • Vue.js
  • Datadog

クラウドワークスのSREチームでは、crowdworks.jpのインフラ安定稼働とシステムの心理的安全性向上に取り組みます。データ分析基盤の運用改善、インフラのコード化、モニタリング、セキュリティ対策、障害調査および対応など、システムの信頼性と効率性を高める幅広い業務を担当します。

Other offers from this company

Login to see all the remaining offers.

By registering with LabBase Plus you...

Picture of search page on product

You can select from our vast stock of job offers.

  • Can view all curation offers.
  • Receive notifications of new offers added to curations.
  • Possibly be scouted by corporations.
  • Search for companies with unique technologies.
  • Search for job offers in areas like inorganic chemistry material science.

Registration takes roughly 2 minutes