機械学習エンジニア / Data Labs・LINE BRAIN / OCR and Document Intelligence

雇用形態
正社員
業務内容
このポジションでは、データの分析・研究・応用のための専門的な開発組織であるLINE Data labsチームの機械学習エンジニアとして、
NAVER社のClova AI・Clova OCR チームと共同でOCR技術を開発し、LINE BRAINチームとともにOCR技術を活用した様々なサービスを展開していける方を募集しています。

Clova OCR チームは、Optical Character Recognition (OCR、光学文字認識) 技術の研究・開発専門チームとして、2018年 1月に設立されました。ここで開発された技術は、既に日本・韓国でのLINEサービスや韓国内の様々なOCR関連サービスで活用されています。

【サービスの具体例】
LINE Messenger(OCR機能)、LINE Music(PlayList認識)、LINE Pasha(宝くじ認識)、LINE CONOMI(レシート認識)、LINE BRAIN OCR(定型文書認識)NAVER Pay(クレジットカード認識)、NAVER VIBE(PlayList認識)、NAVER Glace(レシート、事業者登録証認識)、Drama & Company(名刺認識)、SHINHAN BANK(銀行書類認識)

Clova OCRチームの技術は、韓国語・日本語の認識において、極めて高い性能を発揮しています。
OCR 分野の国際大会ICDARでは、様々なCompetitionでTop-classの記録を達成し、2019年には中国語認識の分野で1位を受賞しました。
そして、CVPR/ICCVといったTop Conferenceに関連技術に関する論文を発表し、その技術力が世界に認められています。

[参考URL]
https://demo.ocr.clova.ai/
https://linedevday.linecorp.com/jp/2019/sessions/D1-7
https://rrc.cvc.uab.es/?ch=14&com=evaluation&task=2&f=1&e=2

現在募集している領域は以下の3つです
●Optical Character Recognition (OCR)
画像内の文字を識別するText Detection、Text Detection 後に文字を読むText Recognition、
そしてこの2つを同時に学習する End2Endに関する技術の研究・開発を行います
参考論文:
CVPR2019 https://arxiv.org/abs/1904.01941
ICCV2019 Oral https://arxiv.org/abs/1904.01906

●Document Intelligence
文字認識結果を有効に使えるよう、認識した情報を整理するText Parsing 技術に関する研究・開発を行います。
[具体例]
領収書を認識した後、認識した文字が価額か、商品名か、日付かを判断し、分類する技術です。
この技術とOCR技術を合わせると、レシートをカメラで撮影するだけで、レシートに書かれた文字を項目ごとに整理して、デジタル化することができます。

参考論文: Workshop on Document Intelligence at NeurIPS2019
[1] https://openreview.net/forum?id=SJl3z659UH
[2] https://openreview.net/pdf?id=SJgjf695UB

●Font Generation
手書き文字の生成を目標とした技術の研究・開発を行います。
現在、OCR 認識性能、特に手書き認識性能を高めるために、多様な手書き文字を生成しています。
韓国語で成功した手書きFont生成技術を応用し、日本語での手書きFont生成技術の研究・開発を行います。

参考URL(韓国語)
https://deview.kr/2019/schedule/294#
応募資格
【必須の経験・スキル】
・Tensorflow, PyTorch, MXNet, Caffe2 などOpen source frameworkをもとに開発するスキル
・Machine Learning/Deep Learning モデル設計経験
・最新AI論文を素早く正確に実装する能力

【歓迎する経験・スキル】
・OCR関連プロジェクト経験
・BERTを使用した経験 for Document Intelligence
・GANを使用した経験 for Font Generation
・優れたVisualization & Front-end 開発経験
・ビジネスレベルの英語もしくは韓国語

【歓迎する人物像】
・情熱を持って自律的に業務を遂行できる方
・オープンマインドで、積極的にコミュニケーションを取り、協力する方
勤務地
新宿オフィス
〒160-0022 東京都新宿区4-1-6 JR新宿ミライナタワー23F
勤務時間
専門業務型裁量労働制(1日の労働時間に関わらず1日9.5時間労働したものとみなします。)、フレックスタイム制(コアタイム 11:00〜16:00)、10:00~18:30(実働7時間30分)のいずれか適用 ※面接後に決定
待遇 / 福利厚生
■休日/休暇

・完全週休2日制(土・日)、祝日、年次有給休暇、年末年始休暇、慶弔休暇、リフレッシュ休暇制度(勤続5年で10日間)

■給与

・年俸制(保有されるスキル・経験・能力により優遇、相談の上で決定)
 ・年俸の12分の1を毎月支給。
 ・別途、インセンティブプラン有(※1)
・給与改定:年2回
・諸手当:交通費全額支給、LINE Pay Card Benefit Plan(※2)

(※1)年俸額の他に、会社・本人の業績、評価に応じ、年2回インセンティブを支給することがあります。
(必ず支給されるものではありません。また、支給日に在籍している場合に限り支給対象となります。)
(※2)社員の「健康維持増進」「自己啓発」「次世代育成」を目的として給与とは別に支給する手当です。

■各種保険

・雇用保険、労災保険、健康保険、厚生年金保険

■福利厚生

・定期健康診断
・各種社内イベント他

その他詳細は面談の際にお伝えします。

求人検索タグ

  • 機械学習
  • キャリア採用
  • 東京
  • 本社機能