SRE(Infrastructure)

ミッション

エムスリーが提供するサービス全般のシステム基盤を管理し、可用性とキャパシティを維持することで、ユーザーが安定して快適にサービスを利用できるようにする。

担当事業、サービス

エムスリーが提供する事業・サービス全般。例)m3.com、MR君、AskDoctors

担当業務

商用Webサービスのサーバ・ネットワークの構築・運用を主とするが、開発や検証に必要な環境も管理対象であり、その可用性維持もミッションに含まれる。

  • 会員数数十万規模のWebサービスの監視運用、緊急対応
  • 新規事業・サービスや改修に伴うシステム設計、構築
  • Microservicesシステムの監視、運用、性能管理
  • Dockerを活用したシステムの設計・構築・運用
  • オンプレミス及びパブリッククラウドの運用の自動化や効率化
  • オンプレミスからクラウドへの移行の計画や運用を含めたシステム設計
  • 基盤系新技術の検証や導入
技術スタック

OS: Linux
クラウド: AWS, GCP
開発ツール: Git, GitLab, Jenkins
仮想化技術: Docker, KVM
開発言語: Java, Ruby, Node.js, Go, Perl, Bash
Webサーバ: Apache, Nginx
DB: Oracle, PostgreSQL, MySQL
KVS: Redis, Memcached
監視ツール:, Grafana, Prometheus, Nagios
ログ管理: Elasticsearch, Kibana, Fluentd
構成管理: Ansible, Terraform, Packer
アーキテクチャ: Microservices

チーム体制

エンジニアリング組織は全体で約65名です。その中で、SREチームは6名で活動しています。SLI/SLOはサービスに紐づくため、サービス側のエンジニアとも協力してSLIのモニタリングを行っています。定期的なミーティングも行い、SLOの達成状況を確認しています。

得られる経験・スキル
  • AnsibleやTerraformを用いたInfrastructure as Codeの実践スキル
  • オンプレミスとパブリッククラウド両方のシステム設計、構築、運用の経験
  • ユーザー数数十万規模のWebサービスの運用を通じた監視・キャパシティ計画などシステム管理のノウハウ
  • Microservicesシステムに対する監視や運用の技術
  • 多数のWebサービスの運用経験
  • DockerやECSを用いたシステムの構築・運用技術やノウハウ
応募条件(必須)
  • Linuxシステムに対する基礎的な知識、理解
  • TCP/IPやHTTP通信の基礎知識
  • Webサービスのサーバーサイドの開発や運用に1年以上従事した経験
  • 何らかのプログラミング言語、またはシェルスクリプトの1年以上の利用経験

下記いずれか:

  • オンプレミスのサーバー運用に1年以上従事した経験
  • ネットワークインフラの運用に1年以上従事した経験
応募条件(できれば)
  • シェルスクリプトまたはAnsible等の構成管理ツールによるシステム構成管理の経験
  • Oracle, PostgreSQL, MySQLの運用経験
  • AWS, GCPなどクラウド上でのシステム構築・運用経験
  • Java, Ruby, Python製Webアプリケーションの開発や性能チューニングの経験
  • Perl, Ruby, Goいずれかの言語でのライブラリ等の開発経験
  • DockerやKubernetesを用いたシステム構築・運用経験
  • Linuxシステムに対する深い理解
  • DBMSに対する深い理解