正社員

MLOpsエンジニア

株式会社サイバーエージェント

東京都渋谷区宇田川町東京都渋谷区宇田川町40番1号 Abema Towers 東京メトロ銀座線渋谷駅から徒歩7分
株式会社サイバーエージェントの画像

この求人のポイント

  • 正社員
  • 年収 6,000,000円〜10,000,000円
  • 東京メトロ銀座線渋谷駅から徒歩7分
  • 東京都渋谷区宇田川町

仕事内容

■年収 600~1,000万円 ■仕事内容 【職務内容】当社の機械学習基盤「ML Platform」の開発・運用を担当していただきます。社内のAI技術者やプロダクトチームが効率的かつ迅速に機械学習モデルの開発・デプロイを行えるよう、プラットフォームの機能強化や最適化を行います。 【具体的には】・物理GPUノードのセットアップ(OSインストールやパラメータチューニング) Kubernetesクラスタの構築・運用  ・定期的なKubernetesクラスタのバージョンアップデート 最新のKubernetesバージョンへのキャッチアップなど ・NVIDIA H100 / H200 やRoCEv2/RDMA、NCCLなどの技術検証・導入 ・GPUインスタンスの提供 機械学習ジョブの管理 ・モデルのデプロイ機能の開発・運用 などを行い、ユーザーのニーズに応じた新機能の追加やUXの改善にも取り組んでいただきます。サービスは主にKubernetes上で構築されているため、機械学習の知識に加え、Kubernetesカスタムコントローラー(Go言語)の開発など、kubernetesへの深い理解に基づいた学習サービスの開発・運用を担当します。加えて、Kubeflowなどの機械学習エコシステムの検証・導入・コントリビュートを通じて、基盤の強化と機能拡充を図ります。 【職種の魅力】 このポジションでは、最先端の技術に挑戦する機会が豊富にあります。最新のGPUハードウェアや機械学習フレームワーク、Kubernetesの新機能など、常に技術の最前線で活躍できます。 ソフトウェア開発からインフラ構築、機械学習の応用まで、多岐にわたる技術領域に携わることで、幅広いスキルを習得・活用することが可能です。 ■プログラミング言語 Go言語 Python ■プラットフォーム・オーケストレーション Kubernetes Docker ■機械学習フレームワーク TensorFlow ■分散処理技術 MPI NCCL RoCEv2/RDMA ■機械学習エコシステム Kubeflow Kueue MPI Operator ■ハードウェア NVIDIA GPU(H100など最新モデル) 高性能ネットワークインフラ ■開発手法 アジャイル開発 CI/CDの実践 ■コミュニケーションツール Slack Confluence JIRAなど ■その他の技術要素 ■求める経験 【いずれか必須】 ・機械学習や GPU に対する基本的な知識および理解 ・Linux 環境における開発および運用経験 ・Kubernetes などのコンテナオーケストレーションツールを用いた運用経験 ・プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい) 【歓迎】 ・Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow、 Kueue、 MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験 ■雇用形態 正社員 ■保険 健康保険 厚生年金 雇用保険 労災保険 ■諸手当 通勤手当 住宅手当 技術者に対しての特殊諸手当多数(技術支援金、マルチディスプレイなど他多数)従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度 ■休日休暇 慶弔休暇 年末年始 夏期休暇 有給休暇 週休二日制(土日祝)、リフレッシュ休暇(勤続2年間で5日間、勤続5年間で1ヶ月間)、家賃補助制度(2駅ルール、どこでもルール)

経験・資格

必要資格 【いずれか必須】 ・機械学習や GPU に対する基本的な知識および理解 ・Linux 環境における開発および運用経験 ・Kubernetes などのコンテナオーケストレーションツールを用いた運用経験 ・プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい) 【歓迎】 ・Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow、 Kueue、 MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験
経験 【いずれか必須】 ・機械学習や GPU に対する基本的な知識および理解 ・Linux 環境における開発および運用経験 ・Kubernetes などのコンテナオーケストレーションツールを用いた運用経験 ・プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい) 【歓迎】 ・Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow、 Kueue、 MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験

勤務地・交通

勤務地 東京都渋谷区宇田川町東京都渋谷区宇田川町40番1号 Abema Towers
最寄り駅 東京メトロ銀座線渋谷駅から徒歩7分

給与

給与 年収 6,000,000円〜10,000,000円
待遇・福利厚生 健康保険 厚生年金 雇用保険 労災保険 通勤手当 住宅手当 技術者に対しての特殊諸手当多数(技術支援金、マルチディスプレイなど他多数)従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度

企業情報

企業名 株式会社サイバーエージェント
所在地 東京都渋谷区宇田川町東京都渋谷区宇田川町40番1号 Abema Towers

MLOpsエンジニア「Go×KubernetesでAI開発を加速させるMLOps基盤構築」

この求人に応募する