SRE(Site Reliability Engineer)
キャディ株式会社
- Python
- Linux
- Docker
- TypeScript
- Kubernetes
- PostgreSQL
- SRE
- Datadog
- Node.js
- Google Cloud
- Rust
- GraphQL
- Istio
- Express
- NestJS
- Firestore
- Auth0
- Site Reliability Engineer
- REST
- WebAssembly
- axum
- Git/GitHub
- tonic
- Fastify
- Tokio
- Disel
- SeaORM
- Infrastructure-as-Code
-
¥700万 〜 1000万
-
東京都
-
101名〜1,000名
-
企業ページ
■会社情報
CADDiは、CADDi MANUFACTURINGとCADDi DRAWERの2事業を展開しています。CADDi MANUFACTURINGは調達・製造のワンストップパートナーであり、製造業の経営改革を支援しています。一方、CADDi DRAWERは図面データの活用を軸に、DXの実現を支援しており、製造業全体の改革を目指しています。■仕事内容
SREチームへの配属を想定しており、プロダクトの機能開発と信頼性のバランスを保ち、ユーザーに最大の価値を提供することを目指しています。具体的な活動としては、SLOの実装や運用、負荷の予測設計、リリースエンジニアリングなどを行い、プロダクトの信頼性向上に貢献します。■募集概要
CADDi DRAWER Group Enabling SRE チームに配属され、SRE チームの活動として、プロダクトの機能開発と信頼性のバランスを保ち、ユーザーに最大の価値を提供することを目指します。具体的な業務内容としては、Metrics & Monitoring(SLO の実装、運用、オブザーバビリティの導入推進)、Capacity Planning(負荷の予測設計、負荷テストの設計や実施、インフラ整備による処理能力の適正化)、Change Management(リリースエンジニアリング、漸進的デリバリーなどの普及を含めたリリースエンジニアリング)、Emergency Response(インシデントやオンコール対応方針の整備、定期的な訓練の実施)などが含まれます。また、プロダクト戦略や事業状況に応じて業務内容を適宜見直し、プロダクトの成長を支える仕組み作り、文化の浸透を推進しプロダクトの信頼性を高めていく活動が主な業務内容となります。■必須スキル
・Web アプリケーションの開発・運用経験
・パブリッククラウドの基礎的知識
・Linux の基礎的知識
・Docker 等のコンテナ技術の基礎的知識
・Git/GitHub 等を利用したチーム開発スキル
・日本語での流暢なビジネスコミュニケーションが可能な方(目安として日本語能力N1以上)
■歓迎スキル
・クラウドサービスを利用したアーキテクチャの設計・構築・運用経験
・SRE チームでの実務経験
・Web アプリケーションのバックエンド開発経験(静的型付け言語だと尚可)
・ネットワークに対する基礎知識
・Kubernetes 等のコンテナ技術の運用経験
・再現性を重視したインフラ、Infrastructure-as-Code の実践経験
・Google Cloud を利用したシステムの運用経験
・Datadog 等のモニタリング基盤の構築・運用経験
・50人以上のエンジニアリングチームにおいて技術基盤構築やサービス安定化を担った経験
・分散システムの構築、運用経験