分散ストレージリライアビリティエンジニア / LINE Platform

求人概要 / Role and Responsibility
★English follows★

LINEで一日にやりとりされるメッセージの総数は数百億単位です。これは数千台のサーバーと、
その上で動くRedis Cluster、HBase、Kafkaなどの分散ストレージミドルウェアによって実現されています。
これらの分散ストレージミドルウェアは秒間数百万のクエリを処理したり、
数ペタバイトのデータを扱うのに十分な性能を発揮しますが、
LINE規模の実サービスにおいては、特定の条件下でのみ発生するパフォーマンス劣化の問題に直面したり、
世界中でまだだれも遭遇していないバグを踏み抜くといったことが頻繁に発生します。

このような問題を迅速に発見、調査、解決し、LINEを支える分散ストレージ層の信頼性、
可用性、保全性を高めることに貢献してくれる仲間を募集します。

●Z Part / IMF Part チームのご紹介
https://engineering.linecorp.com/ja/blog/z-part/ (日本語)
https://engineering.linecorp.com/en/blog/z-part-team/ (英語)
LINE Platform Developmentセンター1 参考情報一覧はこちらをご確認ください。



【主な業務内容】
- 分散ストレージミドルウェアやJVMの特性を深く理解しパフォーマンスの改善に必要なチューニングやコードの変更を行う
- Prometheus, Elastic Stack, Grafana などを使ってHBase, Redis Cluster, Kafkaのモニタリング環境を構築し継続的に改善する
- Ansible, Kubernetesなどのツールを用い、上記分散ストレージミドルウェアの運用の自動化、効率化を推進する
- 運用自動化システムの開発を通じて上記分散ストレージミドルウェアの運用コストを最適化する
- 大規模災害時などでもリカバリができるよう、データを効率的に保全するシステムの開発を行う

-業務例:
Reliability Engineering Behind The Most Trusted Kafka Platform
Traffic intensive storages at LINE's Messaging Application

Every day, hundreds of millions of messages are sent over LINE. A combination of thousands of servers and distributed storage middleware (Redis Cluster, HBase, Kafka, etc.) makes this possible—working together to process millions of queries per second and handle several petabytes of data. But a service the size of LINE often encounters problems: bugs that are a world-first, or performance issues that arise only in unique circumstances among others.

Our team is looking for a distributed storage reliability engineer who can pitch in to enhance the reliability, availability, and maintainability of our distributed storage layers—the backbone of the LINE app—by quickly finding, investigating, and solving problems like these.

●Z-Part presentation / Z Part チームのご紹介
https://engineering.linecorp.com/ja/blog/z-part/ (Japanese/日本語)
https://engineering.linecorp.com/en/blog/z-part-team/ (English/英語)
LINE Platform Developmentセンター1 参考情報一覧はこちらをご確認ください。


【Responsibilities】
- Develop a strong understanding of distributed storage middleware and JVM's characteristics, and perform tunings and code edits essential for improving performance
- Use Prometheus, Elastic Stack, Grafana, etc., to build monitoring environments and make ongoing improvements to HBase, Redis Cluster, and Kafka
- Use tools such as Ansible, Kubernetes, etc to automate and streamline LINE's distributed storage middleware, to optimize and reduce its operating costs.
- Develop systems that efficiently maintain data, enabling recovery during large-scale disasters or other emergencies

-Sample presentations of our work:
Reliability Engineering Behind The Most Trusted Kafka Platform
Traffic intensive storages at LINE's Messaging Application
応募資格 / Qualifications
【必須条件・スキル】
- コンピュータサイエンスもしくは関連分野の専攻、またはそれに準ずる実務経験
- Linux/Unix環境での開発・システム運用への精通
- Java/Scala/Kotlin/ClojureなどのJVMベースで動作する言語による開発を問題なく行える能力
- HBase/Redis Cluster/Kafka 等の分散ストレージミドルウェアに対する強い関心
- 自律的に問題を見つけ解決していく姿勢

【歓迎する経験・スキル】
- コンピュータサイエンスもしくは関連分野の修士/博士学位
- HBase、Kafka、Redisなどを用いた大容量データ/大規模トラフィックを扱う分散システムの開発・運用経験
- Elastic Stack/Prometheus/Grafanaなどのモニタリングツールに関する知識・経験
- Ansible/Kubernetesなどのprovisioningツールを用いて大規模サーバー群を運用した経験
- concurrent/multi-threadedなシステムの開発経験
- RDBMS、KVSなど、データベースの内部実装に関わる開発経験
- JVMの内部構造やGCに関する理解、チューニングの経験
- 大規模なコンシューマ向けサービスの開発・運用経験
- 日本語及び英語でのコミュニケーションを学ぶ姿勢

【言語】
- 日本語及び英語でのコミュニケーションを学ぶ姿勢
- 英語:読み書きが可能なレベル

■Qualifications
- Major in Computer Science or a related field, or equivalent work experience
- Experience developing in Linux/Unix environments and system operations
- Proficient in developing with languages that run on JVM, such as Java, Scala, Kotlin, and Clojure
- Strong interest in distributed storage middleware such as HBase, Redis Cluster, and Kafka
- Ability to independently pinpoint and solve issues

■Preferred Qualifications
- Masters or PhD in Computer Science or a related field
- Experience using HBase, Kafka, Redis, etc., in developing and operating distributed systems for large volumes of data and traffic
- Knowledge of and experience in monitoring tools such as Elastic Stack, Prometheus, and Grafana
- Experience using Ansible, Kubernetes, or other provisioning tools to operate large server groups
- Experience developing concurrent and multi-threaded systems
- Experience in developing database systems such as RDBMS and KVS
- Understanding of and experience tuning JVM internal architecture and garbage collection
- Experience developing and operating large-scale consumer services
- Motivated to learn Japanese and English language

■Language Skills
- Communication ability in Japanese or English.
- Ability to write/read in English.
勤務地 / Location
四谷オフィス
〒160-0004 東京都新宿区四谷1-6-1四谷タワー23F
雇用形態 / Employment type
正社員
勤務時間 / Working hours
専門業務型裁量労働制(1日の労働時間に関わらず1日9.5時間労働したものとみなします。)、フレックスタイム制(コアタイム 11:00~16:00)、10:00~18:30(実働7時間30分)のいずれか適用 ※面接後に決定
待遇・福利厚生 / Benefits
■休日/休暇
・完全週休2日制(土・日)、祝日、年次有給休暇、年末年始休暇、慶弔休暇、リフレッシュ休暇制度(勤続5年で10日間)

■給与
・年俸制(保有されるスキル・経験・能力により優遇、相談の上で決定)
 ・年俸の12分の1を毎月支給。
 ・別途、インセンティブプラン有(※1)
・給与改定:年2回
・諸手当:交通費支給(会社規定による)、LINE Pay Card Benefit Plan(※2)

(※1)年俸額の他に、会社・本人の業績、評価に応じ、年2回インセンティブを支給することがあります。
(必ず支給されるものではありません。また、支給日に在籍している場合に限り支給対象となります。)
(※2)社員の「健康維持増進」「自己啓発」「次世代育成」を目的として給与とは別に支給する手当です。

■各種保険
・雇用保険、労災保険、健康保険、厚生年金保険

■福利厚生
・定期健康診断
・各種社内イベント他

■受動喫煙防止措置の実施
・屋内原則禁煙(屋内に喫煙室あり)
 ・四谷オフィス、南新宿オフィス、大崎オフィス

※当社はオフィス勤務と在宅勤務を組み合わせた、より効率的に高いパフォーマンスを発揮し続ける新しい働き方「LINE Hybrid Working Style」を採用しています。
https://linecorp.com/ja/pr/news/ja/2021/3912

その他詳細は面談の際にお伝えします。
選考フロー
■選考プロセス(1-1.5ヶ月を想定)
書類選考→課題選考→面接2-3回→バックグラウンドチェック→オファー
※課題選考・面接はオンラインにて実施します。