SRE(データ基盤)

ミッション

データ基盤のSREとして、エムスリーが提供するサービスのバックエンドの信頼性を高めることで、顧客やステークホルダーに安定した情報提供を行い、意思決定を助ける。

担当事業、サービス

エムスリーが提供する事業・サービス全般のデータ基盤。例)m3.com、MR君、AskDoctors

担当業務

エムスリーのサービス全般のデータ基盤である「帳票システム」のSREとして、次世代システム基盤の設計、構築、運用を主に担当する。また、既存システムからのシステム移行を主導する。具体的には、以下の通り:

  • 会員数数十万規模のWebシステムのインフラ設計・構築・運用
  • パブリッククラウド上でオブジェクトストレージやDBaaSを組み合わせたデータ基盤の構築
  • Digdagなどワークフローエンジンを使ったシステムの設計・構築
  • オンプレミスからパブリッククラウドへのシステム移行
  • オンプレミスとパブリッククラウドに跨るデータフローの設計
技術スタック

OS: Linux
クラウド: AWS, GCP
開発ツール: Git, GitLab, Jenkins
仮想化技術: Docker, KVM
開発言語: Python, Go, Perl, Bash
DB: Oracle, PostgreSQL, MySQL, RDS
NoSQL: Redis, Memcached, Elasticsearch
監視ツール:, Grafana, Prometheus, Nagios, CloudWatch, Datadog
ログ管理: Elasticsearch, Kibana, Fluentd
構成管理: Ansible, Terraform, Packer
アーキテクチャ: Microservices

チーム体制

エンジニアリング組織は全体で約65名です。その中で、SREチームは6名で活動しています。SLI/SLOはサービスに紐づくため、サービス側のエンジニアとも協力してSLIのモニタリングを行っています。定期的なミーティングも行い、SLOの達成状況を確認しています。

得られる経験・スキル
  • 会員数数十万規模のWebシステムのSREやインフラ設計・構築・運用の経験
  • パブリッククラウド上でのデータ基盤構築の経験
  • Digdagなどワークフローエンジンを使ったシステムの設計・構築の経験
  • オンプレミスからパブリッククラウドへのシステム移行の経験
  • オンプレミスとパブリッククラウドに跨るデータフローの設計経験
  • データ基盤に関する技術検証、導入経験
応募条件(必須)
  • Linuxサーバシステムの運用に1年以上従事した経験
  • AWSまたはGCPにおけるシステム構築・運用経験
  • TerraformやAnsibleなどInfrastructure as Codeの実践経験
応募条件(できれば)
  • Digdag, Embulkなどデータ処理ツールやワークフローエンジンを用いたシステム構築・運用経験
  • Elasticsearch + Fluentd + Kibanaへの習熟
  • AWSまたはGCP上でのデータパイプラインの構築・運用経験
  • DockerやECSなどコンテナ技術を使ったシステムの構築・運用経験