Interviews/

田中 幹大 / AI:Vision

自己紹介をお願いします
Computer Vision Labチームの田中幹大です。2022年4月にLINEへ新卒入社し、働き始めてからまだ半年というところです。大学・大学院の頃からComputer Visionの研究をしていて、今もVision & Languageと呼ばれる視覚情報と自然言語を融合した処理を行うAI技術の研究・開発をしています。

この領域を学んでいた理由は、研究室に配属された際に「ロボットと人との共生」というテーマに興味があったためです。ロボットが実世界で人の生活に溶け込んでいるような未来を考えた時、人と同じように物を見て、人間同士のように人と言葉で意思疎通を行う能力がとても大切になります。そこで、Computer Visionの中でも特に、視覚と言語の双方を扱うマルチモーダルな研究をするようになりました。

LINEを就職先として考えたきっかけは、当時設立されてまだ間もないComputer Vision Labチームの存在を知り、興味を持ったことでした。チームのマネージャーと話をする機会を設けていただき、このチームは実サービスに組み込むためのComputer Vision技術の開発を担いつつ、より未来を見据えた研究も行っていることや具体的な取り組みについて教えてもらいました。設立から1年も経っていない時期だったにも関わらず、確固たる信念を持って成長しているチームであり、メンバーの熱量も高い環境だとわかりました。

話をした当時、私は大学院の博士課程2年生でした。ちょうど今後自分の専門領域の研究に没頭するか、より実サービスに近い研究開発をするか悩んでいたんです。会話の中で「Computer Vision Labチームは、アカデミックな研究と、事業に貢献する研究開発のどちらを重視していますか?」と聞いてみたところ「どちらもやりたい」と熱く語っているのが印象的でした。自分の専門分野にも通じる環境で働けたら絶対に楽しいだろうと考え、LINEに入社することを決めました。私のキャリアに大きく影響したマネージャーが組織のビジョンなどを熱く語っているインタビューもあるので、ぜひ共感してくれると嬉しいですね。

組織としては、私の所属するComputer Vision Labチームは3つのユニットに分かれています。3Dの技術を扱うVirtual humanユニット。ドキュメント解析などを行うIDP(Intelligent Document Processing)ユニット。そして私が所属している、Computer Visionの技術でデザインをサポートするMeta Designユニットです。
業務内容や具体的な流れを教えてください
私の担当領域であるMeta Designに限定した話をすると、私たちはクリエイティブや動画の自動生成や制作支援を行うための研究・開発を行っています。たとえば文章から画像を生成できるサービスやそのアウトプットを最近SNSでよく見かけますが、そのような形で画像・映像素材を生成するということを実際の研究・開発として考えるという仕事です。それ以外にも、クリエイティブに限定せずにさまざまな応用先を見据えて、視覚と言語の両方を扱う研究・開発をしています。

たとえば最近では、動画像のデータからユーザーが入力する任意の日本語テキストの内容に合ったモーメントを検索するデモの実装を行い、画像の認識・理解シンポジウムであるMIRU(Meeting on Image Recognition and Understanding)で展示しました。この研究・開発では「撮りためた大量の動画ファイルから、ある特徴を持った部分だけを抜き出したい」、一方で「モデルの学習やデータ収集といったコストをかけたくない」というユーザーのニーズを満たすことを目指しています。

このプロジェクトがスタートした経緯について説明すると、もともと私はVision & Languageの要素技術であるOpenAIの「CLIP(Contrastive Language-Image Pre-training)」という有名なモデルをなんらかの形で活用したいと考えていました。これは、インターネット上にある大量の画像データとテキストデータをもとに学習をすることで、画像とテキストの汎用的な対応付けができるものです。

この技術を活用して、まずはチームメンバーとともに画像や動画像を検索する簡易的なデモを作成しました。それをマネージャーに見せたところ「クラウドカメラ(防犯カメラ)の利用者には、特定のモーメントを検索したいというニーズがある」と教えてくれました。そこで、先ほど触れたMIRUに出展することになる本格的なデモの実装を行うことを決めたんです。

私はアルゴリズムを担当し、ユニットのリーダーがフロントエンドを担当しました。そして自分たちが予想していた以上に、検索の体験が良いシステムができました。周りの方々からの評判も良好であり、学会でも披露することができて大きな達成感を得られたプロジェクトになりました。
仕事を進める上で、意識していることはありますか
まずは、自分の持っている技術を活用して、世の中により良い影響を与える方法を考えることを大事にしています。単に自分にとって取り組みやすい研究課題を扱うよりも、「世の中にとって本当にインパクトのある取り組みは何か」を考えて、実現していくことが大事だと思います。そういった思考ができるようになるためにも、常に世の中の動きや新しい技術に関心を持ち、アンテナを張っておくことを心がけています。

それから、チームには優秀なメンバーがたくさんいるので、相互に意見を出し合い、みんなでより良い課題解決につながる方法を日々模索しています。私はチームのメンバーたちを心から尊敬しています。彼らがすごいのは、まず決断力があるところ。仕事に取り組む際には、プロジェクトをどうやって進めるのか判断が難しい場面も多いのですが、そんなときにもメンバーの誰かが的確な意見を出し、方向性を示してくれます。それに、私たちのマネージャーはバランスの取れたチームの構成を考えられているので、異なる専門性を持ったメンバー同士でお互いをサポートし合い、リスペクトし合えるような環境と感じます。

意識しているポイントの2つ目は、日々着実に前進することです。難易度の高い課題を前にして途方に暮れてしまうこともあるのですが、そんなときでも必ず着実に進められるタスクというものが存在しています。目標を大きく掲げつつも、自分の足元を見て泥臭く仕事を進めていく。この2つの軸をうまく両立させることが大事です。

最後に、仲間との信頼と協力を意識しています。異なる専門性を持ったチームメンバー同士がうまく力を合わせれば、大きな成果が生まれます。誠実な仕事やコミュニケーションをして、仲間との信頼関係を築いていくことが重要だと感じています。
おもしろいことや難しいことなど、働く中でこれまでに得た感触を教えてください
自分は研究に取り組むことそのものが好きなので、興味のある論文を読み、Computer Vision Labチームのメンバーと一緒に、どう応用できるかを考えたり議論したりするのが楽しいです。一人ひとりの裁量が大きい環境であることも魅力です。

その反面、仕事をやっていて難しさを感じることもあります。自由度が高いことの裏返しではあるのですが、企業に所属しつつ研究・開発を行う上では「自分の研究領域をいかにして事業に結び付けていくか」を考える設計能力が求められます。

大学・大学院時代には事業との結び付きを考えるような制約がなかったからこそ、社会人になってからその点を特に難しく感じています。全社ミーティングなど広い情報が扱われる機会がある際には、他の事業部やチームが何に取り組んでいるのかをインプットし、自分の持つ技術とつなげていく方法を考えることを意識しています。

入社時と比べて成長できた点として、自分自身の技術的な専門範囲が少しずつ広がっていることが挙げられます。かつての私は、Vision & Languageの中でも限定された領域の研究のみをやっていました。LINEに入社してさまざまな技術に触れ、いくつも新しい挑戦に取り組んでいるうちに、自分の専門性も活かして強めながらスキルの幅の拡張もできてきていると感じます。
LINEに入社して良かったと感じることはなんですか
Computer Vision “Lab”という名前が示すように、このチームはまるで研究室のような雰囲気があります。全員が自分の仕事と真剣に向き合っていますし、専門性が高くかつ人柄の穏やかな人が多い。周囲からの建設的なサポートも受けやすい環境です。それに、LINEは各種の計算資源や社内制度などが整っており、必要性の低い雑務にとらわれることなく、研究・開発に集中できます。

LINEの企業風土で他に特徴的なのは、これほど大きな会社であるにもかかわらず、各プロジェクトを少数精鋭のチームで運営していること。個々のメンバーのスキルやマインドが尊重されています。自分の専門性を業務でフルに生かせますし、働き甲斐を感じます。

私の今後におけるキャリアの大きな目標としては、トップカンファレンスと呼ばれる権威のある学会に挑戦しつつ、その研究が事業貢献にも結び付くような好循環を実現したいです。より短期的には、リサーチャーとして学会に論文を投稿することや、より多くの人々に利用されるデモの制作や実サービスの改善に携わることを目標にしています。
最後にメッセージを
Computer Vision Labチームにはエンジニアとリサーチャーの両方が所属しており、人材の多様性があります。技術的な専門性を持った人であれば、さまざまな形で貢献できる環境です。そして、すべてのメンバーに共通しているのは、各々が自分の専門分野を愛しており、その領域に自信と誇りを持っていることです。

学生時代に研究を頑張ってきた人は、非常に重宝される場所です。また、人の役に立つものを作りたいとか、研究領域を実サービスにつなげたいという熱意を持った人にもマッチするはずです。いま研究をしている学生の方々は、自分の研究と真摯に向き合い、課題の設定から実験、論文を執筆して学会に投稿するまで全工程をやりきる経験をしておくことが本当に大切だと思います。自分自身で課題を深く考えて解決のための施策を実践するスキルは、社会人として働き始めてから必ず生きてきます。

LINEという会社は、有名なサービスや大勢のユーザーを抱えています。だからこそ、実際に人の役に立つ研究を追求していくには理想的な環境です。熱意を持ち、Computer Vision Labチームを一緒に盛り上げてくれる人が、さらに私たちのチームに増えることを期待しています。