この求人のポイント
- 正社員
- 年収 6,000,000円〜10,000,000円
- 東京メトロ銀座線渋谷駅から徒歩7分
- 東京都渋谷区宇田川町
仕事内容
■年収
600~1,000万円
■仕事内容
【職務内容】当社の機械学習基盤「ML Platform」の開発・運用を担当していただきます。社内のAI技術者やプロダクトチームが効率的かつ迅速に機械学習モデルの開発・デプロイを行えるよう、プラットフォームの機能強化や最適化を行います。
【具体的には】・物理GPUノードのセットアップ(OSインストールやパラメータチューニング) Kubernetesクラスタの構築・運用
・定期的なKubernetesクラスタのバージョンアップデート 最新のKubernetesバージョンへのキャッチアップなど
・NVIDIA H100 / H200 やRoCEv2/RDMA、NCCLなどの技術検証・導入
・GPUインスタンスの提供 機械学習ジョブの管理
・モデルのデプロイ機能の開発・運用 などを行い、ユーザーのニーズに応じた新機能の追加やUXの改善にも取り組んでいただきます。サービスは主にKubernetes上で構築されているため、機械学習の知識に加え、Kubernetesカスタムコントローラー(Go言語)の開発など、kubernetesへの深い理解に基づいた学習サービスの開発・運用を担当します。加えて、Kubeflowなどの機械学習エコシステムの検証・導入・コントリビュートを通じて、基盤の強化と機能拡充を図ります。
【職種の魅力】
このポジションでは、最先端の技術に挑戦する機会が豊富にあります。最新のGPUハードウェアや機械学習フレームワーク、Kubernetesの新機能など、常に技術の最前線で活躍できます。
ソフトウェア開発からインフラ構築、機械学習の応用まで、多岐にわたる技術領域に携わることで、幅広いスキルを習得・活用することが可能です。
■プログラミング言語 Go言語 Python ■プラットフォーム・オーケストレーション Kubernetes Docker ■機械学習フレームワーク TensorFlow ■分散処理技術 MPI NCCL RoCEv2/RDMA ■機械学習エコシステム Kubeflow Kueue MPI Operator ■ハードウェア NVIDIA GPU(H100など最新モデル) 高性能ネットワークインフラ ■開発手法 アジャイル開発 CI/CDの実践 ■コミュニケーションツール Slack Confluence JIRAなど ■その他の技術要素
■求める経験
【いずれか必須】
・機械学習や GPU に対する基本的な知識および理解
・Linux 環境における開発および運用経験
・Kubernetes などのコンテナオーケストレーションツールを用いた運用経験
・プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい)
【歓迎】
・Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow、 Kueue、 MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験
■雇用形態
正社員
■保険
健康保険 厚生年金 雇用保険 労災保険
■諸手当
通勤手当 住宅手当 技術者に対しての特殊諸手当多数(技術支援金、マルチディスプレイなど他多数)従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度
■休日休暇
慶弔休暇 年末年始 夏期休暇 有給休暇 週休二日制(土日祝)、リフレッシュ休暇(勤続2年間で5日間、勤続5年間で1ヶ月間)、家賃補助制度(2駅ルール、どこでもルール)
経験・資格
| 必要資格 | 【いずれか必須】 ・機械学習や GPU に対する基本的な知識および理解 ・Linux 環境における開発および運用経験 ・Kubernetes などのコンテナオーケストレーションツールを用いた運用経験 ・プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい) 【歓迎】 ・Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow、 Kueue、 MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験 |
|---|---|
| 経験 | 【いずれか必須】 ・機械学習や GPU に対する基本的な知識および理解 ・Linux 環境における開発および運用経験 ・Kubernetes などのコンテナオーケストレーションツールを用いた運用経験 ・プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい) 【歓迎】 ・Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow、 Kueue、 MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験 |
勤務地・交通
| 勤務地 | 東京都渋谷区宇田川町東京都渋谷区宇田川町40番1号 Abema Towers |
|---|---|
| 最寄り駅 | 東京メトロ銀座線渋谷駅から徒歩7分 |
給与
| 給与 | 年収 6,000,000円〜10,000,000円 |
|---|---|
| 待遇・福利厚生 | 健康保険 厚生年金 雇用保険 労災保険 通勤手当 住宅手当 技術者に対しての特殊諸手当多数(技術支援金、マルチディスプレイなど他多数)従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度 |
企業情報
| 企業名 | 株式会社サイバーエージェント |
|---|---|
| 所在地 | 東京都渋谷区宇田川町東京都渋谷区宇田川町40番1号 Abema Towers |
MLOpsエンジニア「Go×KubernetesでAI開発を加速させるMLOps基盤構築」