分散ストレージリライアビリティエンジニア (Distributed Storage Reliability Engineer)【LINEプラットフォーム】

雇用形態
正社員
業務内容
LINEで一日にやりとりされるメッセージの総数は数百億単位です。これは数千台のサーバーと、
その上で動くRedis Cluster、HBase、Kafkaなどの分散ストレージミドルウェアによって実現されています。

これらの分散ストレージミドルウェアは秒間数百万のクエリを処理したり、
数ペタバイトのデータを扱うのに十分な性能を発揮しますが、
LINE規模の実サービスにおいては、特定の条件下でのみ発生するパフォーマンス劣化の問題に直面したり、
世界中でまだだれも遭遇していないバグを踏み抜くといったことが頻繁に発生します。

このような問題を迅速に発見、調査、解決し、LINEを支える分散ストレージ層の信頼性、
可用性、保全性を高めることに貢献してくれる仲間を募集します。

【主な業務内容】
- 分散ストレージミドルウェアやJVMの特性を深く理解しパフォーマンスの改善に必要なチューニングやコードの変更を行う
- Prometheus, Elastic Stack, Grafana などを使ってHBase, Redis Cluster, Kafkaのモニタリング環境を構築し継続的に改善する
- Ansible, Chefなどのツールを用い、上記分散ストレージミドルウェアの運用の自動化、効率化を推進する
- 大規模災害時などでもリカバリができるよう、データを効率的に保全するシステムの開発を行う
応募資格
【必須条件・スキル】
- コンピュータサイエンスもしくは関連分野の専攻、またはそれに準ずる実務経験
- Linux/Unix環境での開発・システム運用への精通
- Java/Scala/Kotlin/ClojureなどのJVMベースで動作する言語による開発を問題なく行える能力
- HBase/Redis Cluster/Kafka 等の分散ストレージミドルウェアに対する強い関心
- 自律的に問題を見つけ解決していく姿勢

【歓迎する経験・スキル】
- コンピュータサイエンスもしくは関連分野の修士/博士学位
- HBase、Kafka、Redisなどを用いた大容量データ/大規模トラフィックを扱う分散システムの開発・運用経験
- Elastic Stack/Prometheus/Grafanaなどのモニタリングツールに関する知識・経験
- Ansible/Chef などのprovisioningツールを用いて大規模サーバー群を運用した経験
- concurrent/multi-threadedなシステムの開発経験
- RDBMS、KVSなど、データベースの内部実装に関わる開発経験
- JVMの内部構造やGCに関する理解、チューニングの経験
- 大規模なコンシューマ向けサービスの開発・運用経験

【言語】
- 日本語:業務推進が可能なコミュニケーション能力
- 英語:読み書きが可能なレベル
勤務地
新宿オフィス
〒160-0022 東京都新宿区4-1-6 JR新宿ミライナタワー23F
勤務時間
10:00~18:30(実働7時間30分)
待遇 / 福利厚生
【休日/休暇】
完全週休2日制(土・日)、祝日、年次有給休暇、年末年始休暇、慶弔休暇、
リフレッシュ休暇制度(勤続5年で10日間)

【給与】
年俸制
-保有されるスキル・経験・能力により優遇、相談の上で決定
-別途、インセンティブプラン有

・諸手当:交通費全額支給、LINE Pay Card Benefit Plan(※)
・給与改定:年2回
・インセンティブプラン:年2回
※社員の「健康維持増進」「自己啓発」「次世代育成」を目的として給与とは別に支給する手当です。

【福利厚生】
◆各種保険
雇用保険、労災保険、健康保険、厚生年金保険

◆福利厚生
定期健康診断、各種社内イベント他

その他詳細は面談の際にお伝えします。