ソフトウェアエンジニア / Data Platform

求人概要
数億人のユーザ数を誇るLINEは、メッセンジャーを始め、金融・コンテンツ・AIなど様々なサービスを提供しています。Data Science & Engineering Center(DSEC)では、LINEを通じて生成される膨大なデータを活用するために、データを収集し活用するためのプラットフォームの提供、事業のサービスプランニング・マーケティング担当者を対象としたデータ活用の促進、データの民主化を実現するための環境の提供を行います。Data Platform室では、それらサービスから集まる1000種類以上のデータを収集し、分析、活用するためのプラットフォームを提供しています。

■本ポジションについて
ユーザーの行動データを収集するためのプラットフォーム開発を担当するApplication Trackingチーム、データ分析関連のアプリケーション開発を担当するPlatform Serviceチーム、Hadoopをメインとした分散ストレージ・処理基盤の開発・運用を担当するData Infrastructureチームの3つのチームにて、ソフトウェア・エンジニアを募集しています。

【Application Trackingチーム】
各開発チームのハブとなり、企画、調整を進めていきます。具体的には、下記のような業務を担当いただきます。

・収集したデータを可視化するためのバッチ、APIサーバー開発
・Web/iOS/AndroidのトラッキングシステムをSDKからバックエンドまで全て刷新するプロジェクトも進行中(dailyでwebトラッキングデータが60億レコード、iOS/Androidトラッキングデータが400億レコードと大規模なデータシステムを刷新します)
・iOS/Android/Webの内製SDKを開発、運用しているチームとの調整
・バックエンドを担当しているData InfrastructureチームやIngestion Pipelineチームとの調整
・ツールのフロントエンド周りを担当しているData Visualizationチームとの調整

このチームの魅力は、大規模なデータシステムを上から下まで触れられること、またこのような環境で出てくる問題(例えば任意の期間、ディメンジョンで高速にユニークカウントする方法を検討するなど)にチャレンジできることです。

トラッキングシステムに関しての参考資料:https://www.slideshare.net/linecorp/why-lines-frontend-development-team-built-the-web-tracking-system

【Platform Serviceチーム】
Data Platform室では、LINEのすべてのデータを統合して扱うデータプラットフォームの構築を目指しています。LINEでは1000種類を超えるデータを収集しており、様々な組織がこのデータを活用しています。Platform Serviceチームは、分析者がデータ利活用をスムーズにできるよう、self-service化されたポータルサイトの開発を担当しています。
具体的には、下記のような業務を担当いただきます。

・Data Platformポータルサイトの設計・開発
・権限管理機能の開発
・Data Catalog機能の開発
・BIツールの開発
・分析を支援するサービスの開発
・Apache Zeppelinのようなノートブックサービスの開発
・Presto, Hive, Sparkをバックエンドとしたクエリ実行ツールの開発
・Hadoopデータのupload/downloadをサポートするREST APIサービスの開発

【Data Infrastructureチーム】
Data Infrastructureチームは、Data Platformを構成するミドルウェアの開発と運用を担当しています。Hadoop EcosystemをはじめKafka、Elasticsearch、PrestoなどのOSSを大規模で運用しているのが特徴です。大規模運用ならではの問題に直面することも多く、upstreamにpatchを実装して、OSSに貢献する機会も多いです。
具体的には、下記のような業務を担当いただきます。

・業界の変化に伴い、新たなミドルウェアの検討と導入
・大規模システムの安定運用のためのソフトウェアの改善

■使っているツール/開発環境
分散ストレージ - Kafka/Elasticsearch
ストリーミング処理 - Flink/Fluentd
Hadoopエコシステム - HDFS/YARN/Hive/Presto/Spark
運用・モニタリング - Kuberenetes/Ansible/Grafana/Prometheus/Promgen
ジョブ管理 - Azkaban/Airflow
BIツール - Tableau/yanagishima/OASIS(internal BI tool)
開発環境 - IntelliJ/Github/Jenkins/CircleCI/Drone
開発言語・フレームワーク - Java/Kotlin/Scala/Python/Spring
応募資格
【必須の経験・スキル】
・コンピュータサイエンス・情報系の学士/修士/博士学位のいずれか、またはそれに準ずるスキル
・データ構造、アルゴリズム、計算量分析などのコンピュータサイエンスの基礎的素養
・JVM言語(e.g. Java/Scala/Kotlin)でシステムを開発、運用、トラブルシューティングできること
・JVM GCのトラブルシューティング・チューニングができること
・Concurrent/multi-threadedシステムの理解
・Linux/Unix環境での開発・システム運用
・Ansibleなどのプロビジョニングツールを使ってマシンを適切にセットアップできること
・モニタリング、監視を適切に設定できること
・簡単なSQLがかけること

【歓迎する経験・スキル】
・Google Analyticsのようなユーザの行動データを分析するツールに対する理解
・大規模システムあるいは分散システムを設計、分析、問題解決できること
・データパイプライン基盤の設計スキル
・Kubernetesを始めとするコンテナ関連技術を用いたシステム構築スキル
・プロダクションサービスの開発経験
・Spring bootやArmeriaフレームワークの利用経験
・オープンソースへの貢献
・CI/CDの経験
・Apache Kafka、AWS Kinesis、Cloud Pub/Subなどのメッセージブローカーをベースにしたアプリケーション開発経験
・Kubernetesベースのアプリケーションの開発・デプロイ経験
・Apache Hadoop、AWS EMR、Cloud Dataproc、機械学習パイプラインなどのビッグデータ領域の経験
・セキュリティ、認証、認可、監査の知識

【歓迎する人物像】
・多種多様なユーザからのニーズを把握する力
・自律的に問題を見つけ解決していく姿勢
・必要があれば他チームを巻き込んで調整していける方
・分散システムやデータに関する興味、関心
・新しい技術の探求など知的好奇心、チャレンジ精神のある方
・難しい問題や複雑な問題を解決に取り組める方
勤務地
新宿オフィス
〒160-0022 東京都新宿区4-1-6 JR新宿ミライナタワー23F
雇用形態
正社員
勤務時間
専門業務型裁量労働制(1日の労働時間に関わらず1日9.5時間労働したものとみなします。)、フレックスタイム制(コアタイム 11:00〜16:00)、10:00~18:30(実働7時間30分)のいずれか適用 ※面接後に決定
待遇 / 福利厚生
■休日/休暇

・完全週休2日制(土・日)、祝日、年次有給休暇、年末年始休暇、慶弔休暇、リフレッシュ休暇制度(勤続5年で10日間)

■給与

・年俸制(保有されるスキル・経験・能力により優遇、相談の上で決定)
 ・年俸の12分の1を毎月支給。
 ・別途、インセンティブプラン有(※1)
・給与改定:年2回
・諸手当:交通費全額支給、LINE Pay Card Benefit Plan(※2)

(※1)年俸額の他に、会社・本人の業績、評価に応じ、年2回インセンティブを支給することがあります。
(必ず支給されるものではありません。また、支給日に在籍している場合に限り支給対象となります。)
(※2)社員の「健康維持増進」「自己啓発」「次世代育成」を目的として給与とは別に支給する手当です。

■各種保険

・雇用保険、労災保険、健康保険、厚生年金保険

■福利厚生

・定期健康診断
・各種社内イベント他

■受動喫煙防止措置の実施

・屋内原則禁煙(屋内に喫煙室あり)
 ・新宿オフィス、大崎オフィス、南新宿オフィス、四谷オフィス
・屋内禁煙(屋外に喫煙場所あり)
 ・西新宿オフィス

その他詳細は面談の際にお伝えします。