はじめに
2021年にAI系トップカンファレンスの1つであるIJCAI-21 (The 30th IJCAI 2021 international Joint Conference on Artificial Intelligence)に私の単著論文が採択されました。
私は学生時代も含めて査読付きの論文を書いたことがなく、AIは社会人になってから学んだ分野で専門的なバックグラウンドもなく、英語もTOEIC600点程度と、正直かなり分が悪い戦いだったと思います。実際、採択までに2度の落選も経験しました。ただ逆に言うと、こういうスタートラインでもトップカンファレンスに採択されたということです。
このような自分の経験は、 今からAIを始める方や、これまでアカデミックな分野から離れている方々等にとって有益な情報になるのではと思い、本記事を作成しました。
動機
私が初めて参加したAI系のトップカンファレンスはNIPS2017でした。正直発表の内容はほとんど分からなかったのですが、この時に関わらせていただいたいろんな人から刺激を受け、いつか自分も発表をしたいと思いました。また、日本の古い大企業に属していて、個人の業績は目立たない環境だったので、トップカンファレンスでの発表で自分の市場価値を高めたいという思いも持ちました。
次に参加したのはICML2019で、このころは分野によっては発表の内容をなんとなく理解できるようになってきていました。また、ここで交流を持った方に次のIJCAI2020が日本で開催されるという話を聞いて、この機会にとにかく何か投稿してみようと決めました。
IJCAI-PRICAI2020への投稿(落選:summary reject)
幸い自分には論文発表できそうなネタはあったので、まずは論文を投稿することの了解を得るための社内調整から始めました。詳細は書きませんが、周りは自分の挑戦をみな後押ししてくれる人ばかりであったという好条件にもかかわらず、2カ月程度調整に時間がかかりました。会社に近年この手の経験が乏しいことや、知財部門、事業部門、所属部門の了解を部門を行ったり来たりしながら部長レベルまで一つ一つ取っていく必要があったためだと思います。
次に、論文の構成を練りました。IJCAIの1年前の論文を何本か読んで、章立てが多くのパターンでAbstruct, Introduction, Related Work, Method, Experiment, Conclusionになっていることを理解したのですが、改めて考えると自分の技術がどのような分野に属しているのかを知らず、検索ワードもどのようにしたら良いか分かりませんでした。検索というのは、キーワードが分からないとダメなんだな、というのを感じました。社内に聞けそうな人もいませんでした。仕方ないので自分の技術は新規分野という前提で論文を書く方針にしました。
松尾研の以下記事を見て、7回修正するスケジュール感で進めたので、かなりハードワークになりました。
http://ymatsuo.com/japanese/ronbun_eng.html
書いていて、これはと調べるたびに、新しい文献をチェックする必要が出てきて、1日かかってIndroductionが1行しか進まないような日もありました。手法のパラメータが多いと説明が大変なのでパラメータを調整するなどの手法やプログラムの見直しも必要でした。実験も良さを示すために改めて練り直すことが必要でした。英文は自分で作成し、英文校正を受けながら進めましたが、校正業者のスケジュールも考慮する必要がありました。投稿ページにはいろんな入力欄があり、意味を知らないものやどうしていいか分からないものが多数ありました。
そんなこんなでフラフラになりながらなんとか仕上げて投稿しましたが、1か月後に届いた結果はsummary rejectでした。これは1次選考で落選したことを意味します(全体の約40%がsummary rejectで落選)。力が足りなかったのだから仕方ないと思いつつもさらに厳しかったのが、summary rejectは落ちた理由が何も示されないこと。~が足りない、弱い、等の指摘があれば次の作戦も練れるのですが、これは本当に何も分からないのでかなり暗礁に乗り上げた感じがありました。
AAAI 2020への投稿(落選:reject)
ここで諦めたらもったいないと思い、同じネタを調整してAAAIへの投稿を目指すことにしました。ただ、前回の投稿では何もコメントがもらえなかったので、まずは何故落ちたのかが知りたいと思いました。悩んだ挙句、分野が関係ある研究をされていて、かつトップカンファレンスに論文が多数採択されている大学の先生の中から直感で決めた人にメールで相談を依頼することにしました。
その先生は親切な方で私の不躾の依頼を承諾くださり、企業の人がカンファレンスを目指すならぜひ応援したい、とも言っていただけました。例によって先生に依頼するための社内及び大学の手続きに1か月以上を要したものの、有識者のアドバイスを受ける機会を作ることが出来ました。
先生の指摘は、論文の言いたいことが伝わらなかったことが原因と思われる、というもので、論文の文章の1つ1つについて、この単語の意味が曖昧、なぜこの文章がここにあるのかが読み手が分からない、といった具体的な指摘を提示いただけました。また比較している技術分野に~が抜けている、実験内容が不足しているというような技術的なレビューもいただけ、具体的な参考書籍や論文も示していただけ、本当に目から鱗でした。その上で、提案している技術自体はAAAIやIJCAIで通用しうるものと思われるという励ましもいただけました。
指摘を元に論文構成を練り直す上で、特に以下の書籍が参考になりました。この書籍に書かれているフレームワークに沿ってストーリを作ったという感じです。自分が誤解していた点の例としては、私はそれまで論文では自分の技術が他の技術とどう違うかを幅広く示そうとしていたのですが、実はその重要度は低く、それよりも自分の技術がどの分野に貢献するか、どんな人の役に立つかを書くことが重要だった、といったものが挙げられます。
練り直した内容で投稿したところ、1次選考を通過し2次選考(最終選考)に進むことが出来ました。2次選考では4名程度のレビューワからコメントを受け、その内容に対して反論するプロセスが設けられます。レビューワのコメントは的を射たもので論文の意図は正しく伝わっているように感じました。レビューワの1人からこの分野のSOTAアルゴリズムとの比較がされていないという指摘があり落選となりましたが、技術内容については評価され、「指摘したSOTAアルゴリズムとの比較をしてIJCAIやAAAIに再提出するよう強く薦める」というコメントを頂くことが出来ました。落選ではありましたが、前回と比べて前に進んでいることを感じられて充実感はありました。
IJCAI-21への投稿(採択:accept)
前回のAAAIへの投稿で手ごたえは感じていたものの、そろそろ通さないと活動の予算が得られない可能性があり、この調整がラストチャンスというのを感じながら進めました。比較実験でなかなか良い結果が出せなかったので、SOTA手法と比べて互角以上の性能という言い方が出来るような結果を用意して、かつどのような時に有利になりそうかという考察を書いて補助する作戦にしたところ、点数的にぎりぎりだったと思うのですが、採択されることが出来ました。
おわりに
トップカンファレンスに論文が採択されることで、自分の技術が世界レベルであるというお墨付きがもらえたと感じられ、自信になりました。また、相手企業次第ではありますが、当初の狙い通り市場価値が高く評価されやすくなるという効果も感じました。一方で、何件も通っている人、通った論文が表彰される人、通った論文が多数引用される人、等々、より優れた人が沢山いることも改めて感じるようになりました。今回の経験をゴールにするのではなく、スタートにできるように、今後も頑張っていきたいと思います。
補足
AI系トップカンファレンスについて
AI系の学会は数が多く把握し辛いのですが、以下のマップが整理されていて分かり易いです。トップカンファレンスという言葉の定義は明確ではないのかもしれませんが、1例として以下のサイトではインパクトスコアという指標に基づいてランキング付けされています。この指標は論文の引用数等に基づいて定められているようです。
https://www.guide2research.com/topconf/
https://www.guide2research.com/our-methodology#impact-score
トップカンファレンスに論文を投稿する難しさはその採択率の低さに依存しており、IJCAI2021では13.9%という低さでした。
レビュー方式や内容について
本内容については以下URLがよくまとまっていると思います。
https://www.ai-gakkai.or.jp/jsai2020/wp-content/uploads/sites/10/2020/06/jsai2020_tutorial_suzuki.pdf
また、IJCAI2021のレビュー方法については以下のように説明されているので参考までに張り付けておきます。ざっくり要約すると、10人程度のレビューワが流し読みで1次レビューをして、そこで落とされるとsummary reject、その後5人程度のレビューワが隅々まで読む2次レビューをして、コメントをし、著者が反論、それらから通過と判断されると採択されるという形式でした。
レビュー内容は以下のように決められたフォーマットに従ってレビューワがまとめていく形式になっています。これを見ると、新規性、正しさ、影響度、明確さ、裏付け度合い、再現性等の視点で整理され、さらに具体的な強みと弱みを整理した上でスコアがつけられるようです。