Chatworkの可用性・パフォーマンスの維持向上を行う、SRE募集!
【仕事内容】
24万社を超えるお客様にご利用いただいているChatworkのサービスを安定して提供できるように、アプリケーションの実行基盤の整備を始め、幅広い業務を担当しています。
SRE部の業務に関しては、この限られたスペースでは表現しきれない部分もたくさんあり、以下のリンクに、過去の取り組みが一部まとまっているとともに、チームの雰囲気も感じていただけると思いますので、是非ご覧になってみてください!
SREブログ:https://creators-note.chatwork.com/archive/category/SRE
【具体的な仕事例】
・アプリケーションの実行基盤作り
∟ 全アプリケーションをkubernetes上で稼働させるための導入推進とcluster運用、CI/CDの整備を行なっています
・AWSインフラの最適化、Infrastructre as codeの推進
∟ コスト削減やAWSインフラの構成改善等、非機能部分の改善はSRE部が中心となって行います
∟ 全AWSリソースのTerraform化によるcode化を進めています
・monitoringとalertの整備、インシデント対応
∟ Datadog, NewRelic, Pagerdury等のSaasをフル活用しています
∟ インシデント発生時は、サーバサイド部のメンバーと協力しながら、原因特定、解決、恒久対策を行います
・データストレージの運用
∟ EC2上にホスティングしているHBase、Kafkaや、EMRベースのHBase、Amazon Aurora、AWS Elasticsearch serviceなど、複数種類のストレージの監視や運用を行なっています
∟ 既存ストレージのversion upや、別プロダクトへのリプレイスもSRE部が中心となって行います
【技術スタック】
パブリッククラウド: AWS
ミドルウェア / データストレージ: Kubernetes, HBase, Kafka, Spark, Elasticsearch, Amazon Aurora
構成管理: Terraform, Ansible, helm, helmfile
CI/CD: CircleCI, Jenkins, ArgoCD
モニタリング: Datadog, NewRelic, Pagerduty
【必須(MUST)】
業務範囲が多岐に渡っているため、全てに当てはまる必要はないです。この中の多くが当てはまるジェネラリスト型エンジニア、いずれか1つに突き抜けているスペシャリスト型エンジニア、両方からの応募をお待ちしています!
・webサービスのインフラ運用経験(AWS等のIaas、オンプレ問わず)
・何らかのデータストレージの構築・運用経験
・Kubernetes等のコンテナオーケストレーションツールの構築・運用経験
・AnsibleやChefを利用してのサーバ構築の経験
・Terraform等を利用した、Infrastructre as codeの実践経験
【歓迎(WANT)】
・大規模システムのモニタリングと、障害発生時のデバッグ経験
・Kafka / HBase / Elasticsearchなど、分散データストレージの構築・運用経験
・分散データストレージ、RDBMSの内部に関する実用的な知識
・RDBMSから、分散データストレージへのシステムの移行経験
・OSSヘの貢献実績
【勤務地】
東京オフィス
〒105-0011 東京都東京都港区芝公園3-4-30 32芝公園ビル7F
大阪オフィス
〒530-0001 大阪府大阪市北区梅田2-6-20-5F
フルリモートも可能です!