NLP(自然言語処理)若手の会(YANS)第12回シンポジウムに参加してきた話
目次
Abstract
沖縄に旅行へ行くついでにNLP若手の会(YANS)第12回シンポジウムに1日半参加してきた.自分以外B4以上の中,B2として今回の最年少の参加であり1,初参加である.ポスター発表,招待講演を聞き,新規性が高く面白い研究テーマに触れることで大きな刺激を受け,これからの勉強のモチベーションが高まった.
YANSとは
NLP若手の会 (YANS) は、自然言語処理および関連分野の若手研究者・若手技術者の交流を促進し、若手のアクティビティを高めることを目指したコミュニティです。なお YANS は Young Researcher Association for NLP Studies の頭文字をとったものです。
引用元:Hatena Blog 「NLP若手の会」
NLP若手の会第12回シンポジウム全体の細かなスケジュールはこちら
参加までの経緯
元々は9/3(日)〜9/6(水)の間,普通に友人と沖縄へ旅行に行く予定でありそのために旅行会社で宿と飛行機の手配もした.7月末,首都大学東京の小町先生のこちらのツイートをきっかけに
今日高校生と話していて、プログラミング好きなら情報科学若手の会に参加してみたら、と紹介してみた(すぐ申し込んだらしい。その行動力、すばらしい。きっと大物になる)。https://t.co/WsCCqGSdar 2泊3日で色んな人と夜な夜な過ごす会。高校生、学部生は楽しめると思う。
— Mamoru Komachi (@mamoruk) 2017年7月29日
各学会における若手の会の存在に気づき,NLP若手の会(以下YANSと略す)のを知ることになる.
YANS要項を一見する.開催場所は「沖縄県那覇市」.「なんだよ,行けるわけねえじゃ〜ん」と一度は落胆するもその開催日を見てみると「9/3(日)〜9/5(火)」とある.なんと自分が沖縄に旅行に行く日とドンピシャで被ったのだ!これは奇跡だ!行くしかないと思い,すぐに友人から了承を得て,参加申し込みをした.予約してある飛行機の時間の関係上,2日目からYANSに参加することにした.
参加までの準備
YANS参加にあたり,その時点で持つ自然言語処理の知識では圧倒的に足りないため,首都大学東京の小町先生のWebページ(このWebページは本当に素晴らしくまとまっています!自然言語処理に少しでも興味を持った同志はこちらのページを参考にすることをお勧めします!)を参考に「言語処理のための機械学習入門」を読み終えてからYANSに臨むこととなった.
この付け焼き刃はそれなりに役に立ったが,ニューラルネットワーク関連の知識が全く無いことを後に痛感することになる.
YANS2日目2
大まかなスケジュールは以下の通り.
スポンサー発表(1),ポスター発表(2)
8:30くらいに会場に着き,委員さんの指示に従い参加登録をし,8:55から始まるスポンサー発表が始まるのを待つ.しかし時間になっても席は3分の1ほどしか埋まっていない.どうやらYANSの皆さんは朝の集まりが悪いようだ……
スポンサー4社の発表を聞き, ポスター発表に移る.全体17件の内,僕が聞いた発表は以下の4つ
- ポスター発表P17 クラウドソーシングを系に組み込んだテキストからの関係知
識抽出
- 松田耕史(東北大), 岡崎直観(東工大), 乾健太郎(東北大)
- ポスター発表P18 言語の構造的特徴はなぜ、どのように変化するのか
- 村脇有吾(京大)
- ポスター発表P21 擬似対話コーパス構築のための対話品質推定
- 高山隼矢, 荒瀬由紀(阪大)
- スポンサー・ポスター発表S06 対話返答生成における個性の追加反映
- 濱田晃一, 藤川和樹(株式会社ディー・エヌ・エー), 小林颯介, 菊池悠太, 海野裕 也(株式会社Preferred Networks), 土田正明(株式会社ディー・エヌ・エー)
ニューラルネットワーク弱者の僕は当然こう思う.「CNN,RNNってなんですか?」
帰ったらすぐにニューラルネットワークを勉強しなければ……
昼飯バーベキュー
その後,昼飯のバーベキューへ.10人程度が1つのテーブルにつく.様々な人とお話をさせていただいた.1人の企業の方と特に仲良くさせていただいた.その後のことでもそうだが,参加者との交流では基本的に以下の辛いやりとりが繰り返される.
どのような研究をしてるんですか?研究室はどこですか?の質問に対して,
— كازوكي (@mwtndmik) 2017年9月4日
「B2なんで研究とか何も無いんですよ……」と答えるしか無い辛さです.
招待講演(2)
ChainerMN と分散深層学習の今後
講演者:秋葉 拓哉 氏(株式会社 Preferred Networks リサーチャー)
失礼ながら僕はこの講演があるまで秋葉大先生の存在は知らなかった.事前の下調べでなかなかやばそうな人だと思ったが,冒頭の言葉でその認識を改めることになる.
秋葉大先生「深層学習チョットデキマス」
ああ,この人はチョットデキル3を使うことを許された人間なんだ……
また,冒頭の「皆さん深層学習についてよくわかっていると思うので,深層学習の基本的な部分は飛ばします.」の言葉で僕の人権が無くなることが決定した.
その後もいくつかのパワーワードが飛び出す.
「ディープラーニングの世界では6年前は縄文時代」
「1Gb/s Ethernetでの分散深層学習は絶望」
Chainerのすごさがよくわかりました(小並感).
深層学習を勉強しなければ……
(ホテルに帰った後,すぐに「深層学習(機械学習プロフェッショナルシリーズ)」をポチりました)
スポンサー発表(2),ポスター発表(3)
その後3件のスポンサー発表を聞き,ポスター発表へ.全体16件の内,僕が聞いた発表は以下の5つ
- デモ発表D03 ユーザとの対話による発話・応答データ収集機構の試作
- 五十川真生, 近井厚三, 荒瀬由紀(阪大)
- ポスター発表P26 Neural Turing Machine に対するマルチタスク学習の適用
- 田口直弥, 鶴岡慶雅(東大)
- ポスター発表P30 カーネル密度推定に基づく関係予測
- 横井祥, 乾健太郎(東北大)
- ポスター発表P35 対話における応答の対話行為予測
- 大原康平, 佐藤翔悦, 吉永直樹, 豊田正史(東大), 喜連川優(NII)
- スポンサー・ポスター発表S10 用例ベース対話システムに有用な文スコアリングモデルの調査
- 稲村和樹(株式会社サイバーエージェント)
懇親会
その後は上品なレストランで夕食だ.
窓からはこんな景色が.
バーベキューで仲良くさせていただいた人の隣に座りおしゃべりをしていると,なんと左隣には秋葉大先生が……!秋葉大先生と話すことはさすがにできませんでしたが,様々な人と喋らせていただき,楽しい時間でした.
YANS3日目
3日目の大まかなスケジュールは以下の通り.
スポンサー発表(3),ポスター発表(4)
やはり朝は時間通りには始まらず,10分押しほどでスポンサー発表を3件聞き,ポスター発表へ.全体16件の内,僕が聞いたのは以下の4件
- ポスター発表P37 周辺文脈の集合による単語表現の獲得と関係抽出への応用
- 濱口拓男(NAIST), 大岩秀和(RIT), 新保仁, 松本裕治(NAIST)
- ポスター発表P42 分散表現から感情極性は予測できるか?
- 中村拓, 田然, 松田耕史, 乾健太郎(東北大)
- ポスター発表P48 発話スタイル空間の教師なし学習およびスタイル制御可能な対話システムの実現
- 赤間怜奈, 渡邉研斗, 横井祥, 乾健太郎(東北大)
- ポスター発表P49 Character-level Convolutional Neural NetworksにおけるWildcard Trainingの基礎検討
- 北田俊輔, 彌冨仁(法政大)
奨励賞投票,ACL2017参加報告,クロージング
僕が奨励賞にどれを投票したのかは後ほど.
ACL2017の参加報告も様々な知見が得られた.
- Out-Standing Paper, Long Paper 15件の内14件がニューラルネットワークを使用
- reviewを見れば81%の確率でその論文がacceptかrejectかがわかるという研究結果がある
- Author responseをしない場合はスコアが下落する強い傾向がある などなど
クロージングにてアンケートの結果報告,奨励賞の発表を行い,YANS2017の幕を閉じた.
面白かったポスター発表
僕が面白いと感じ,奨励賞に投票させていただいたポスター発表を3つ紹介する.
ポスター発表P18 言語の構造的特徴はなぜ、どのように変化するのか 村脇有吾(京大)
様々な言語ごとの特徴量を数値化した行列データを扱い,言語の変遷を見ようとする研究.テーマ的にも面白く,文系の友人が興味を持ちそうな研究である.しかし状況はなかなか厳しそうである.下処理後でもデータが7割欠けているという絶望的状況からのスタートだ.それをベイズ統計を駆使して欠けているデータを推論し,埋めていくところまでの発表であった.基本的にベイズ統計を使っているので,ニューラルネットワーク弱者の僕でもわかりやすかったのも良かったポイントだ.
ポスター発表P30 カーネル密度推定に基づく関係予測 横井祥, 乾健太郎(東北大)
Deep Learning絶対殺すマンによるPMIの拡張.単語だけでなく,句においても応用でき,学習不要という長所はそのままに,データの疎性に弱いというPMIの弱点を克服した,共起の尺度を提案.様々な分野への応用が期待される.データ数次第ではあるが,「俺たちはまだPMIの拡張で戦っていけるんだ!」という力強い後押しを感じられた.
ポスター発表P48 発話スタイル空間の教師なし学習およびスタイル制御可能な対話システムの実現 赤間怜奈, 渡邉研斗, 横井祥, 乾健太郎(東北大)
発話は「何を話すかを表す意味情報」と「どのように話すかを表すスタイル情報」に分けられるという大胆な仮定に基づき,単語ベクトル空間から意味空間を差し引いてスタイル空間を作成するというもの.最終的には対話システムにおける応答生成への応用を目指す.僕自身対話システムに興味を持つので,なかなか面白く聞かせてもらった.
最後に
新規性が高くて面白い研究テーマの発表が聞ける,企業の方や若手研究者の方と交われる,ご飯代で元が取れてしまうほどに破格に安い参加費で,良いこと尽くめです!来年は絶対に全ての日程で参加します!発表がきちんと理解できるように知識を付けます!自然言語処理に少しでも興味がある方は是非来年のYANSに参加しましょう!
じゃあの〜