SRE (Site Reliability Engineer)
株式会社TORIHADA
-
11名〜100名
仕事内容
【募集背景】 株式会社TORIHADAでは、クリエイター向けWebサービス「FANME」および関連システムを運営しています。 機能開発のリードタイムを短縮する環境整備(例:プレビュー環境)、可用性の高いECS基盤の設計・運用改善、Datadog等を用いたオブザーバビリティの強化を主軸に、継続的な改善を推進しています。 これらを設計から実装、運用改善まで横断してリードしていただくSite Reliability Engineerを募集します。 特定領域の運用担当に閉じず、プロダクトと並走しながら基盤の改善を前に進める役割です。 技術選定や設計の段階から関与し、要件に対して最適な設計・改善を主導できます 数千RPS規模のトラフィックを前提に、可用性/性能/コストのバランス設計と運用改善に取り組めます 共に「意思ある個人による新しい経済をつくる」ことを目指し、感動を生み出すプラットフォームを作っていける方とぜひお話ししたいです! 【業務領域】 このポジションでは、日々の運用を“回す”だけでなく、運用が継続的にスケール取り組む領域は以下です。 ・IaCを前提とした基盤の標準化・変更管理の整備(Terraform) IaCで管理されていない既存リソースの整理・移行を進め、設計の標準化(モジュール/権限/命名/タグ等)やガードレール整備を行います。変更がレビュー可能で再現性のある形で進むよう、ワークフローも含めて整えます。 ・機能開発をアクセラレートするためのインフラ環境整備 開発のリードタイム短縮につながる環境(例:プレビュー環境)の設計・構築・運用を推進します。安全性とスピードを両立するための自動化を進めます。 ・ECS基盤の信頼性向上(設計・構築・運用改善) 可用性、スケーリング、デプロイ戦略、ネットワーク/セキュリティまで含めて、ECS基盤を継続的に改善します。 ・オブザーバビリティ強化とインシデント対応力の向上 Datadog等を用いた監視/検知/可視化を改善し、障害の早期検知と迅速な復旧につながる運用を整えます。必要に応じてSLA/SLO等の指標設計も行い、改善が継続する形に接続します。 ・SRE領域の継続改善(セキュリティ/キャパ/DR/コスト) セキュリティリスクマネジメント、キャパシティプランニング、災害復旧計画(DR)と定期訓練、リソース最適化によるコスト最適化を、基盤運用に組み込みます。 【技術環境】 AWS(主要) Google Cloud(一部) ECS(一部EKS) ※EKSから移行中 Terraform GitHub Actions Datadog GitHub Projects Slack会社情報
株式会社TORIHADAは、ショートムービーマーケティングを行う広告代理店です。TikTokをはじめ、YouTubeショートやLINE VOOM、Instagram Reelsなど様々なプラットフォームを取り扱っています。同社は「意思ある個人による新しい経済をつくる」をパーパスに掲げ、クリエイターエコノミー時代に多様化するビジネスに対応するため、活動する法人・個人を支援するクリエイターDXカンパニーです。ファンマネタイズプラットフォーム「FANME」の運営、SNS・インフルエンサーマーケティング事業、および子会社PPP STUDIOを通じた国内最大規模のショートムービーMCN(マルチチャンネルネットワーク)運営などを展開しています。2017年10月2日に設立されました。ユーザー登録で
よりマッチした求人が見つかる
LabBase転職とは
技術求人に特化した
「パーフェクトサーチ生成AI」です。
膨大な求人から今までできなかった柔軟な条件の検索を。
- 株式会社LabBaseについて詳しく教えて
- 自分の経歴に合った企業を教えて
- LLMモデル開発をしている企業を探したい
- 画像認識企業で独自のデータ/デバイスを持つ企業を探したい
- 無機化学領域でマテリアルズインフォマティクスを活用したい
新規登録は簡単1分で登録完了します。