頼んだピザが固くなった頃に

技術の話を書く。動画配信全般・邦ロックとショートボブの女の子が好き

【推し】SIG2Dが私のおたく機械学習を加速させた

この記事は、【推し祭り】技術書典で出会った良書 Advent Calendar 2019 - Adventarの10日目の記事です。日時誤認してて投稿遅れて申し訳ないです。一生校正してそうなので一度mm

はじめに

私が今回紹介したいのは、SIG2Dです。

f:id:gabdro:20191210153906j:plain
公式サイトより引用

技術書典以前は冬コミケで、それ以降は技術書典4回目まで二次元を中心とした機械学習活用の本となります。 まだ、今ほど本や記事がなかった2013年頃からおたく機械学習を書いており、1読み手として「すごい技術を使って、くだらない面白いことやっていて私もやりたい」って思わせてくれた本。
今日はそんなSIG2Dについて魅力を語りながら、SIG2Dを密かに待ちつつ、またこの本の系統・系譜も最後に紹介できればと思う。
ちなみに、技術書典で販売していた「SIG2D Letters #1」以外については、公式サイトで無料公開されているのでぜひ。

どんな内容が書いてあるか/推し・良さみ

収録内容は、「二次元を対象とした問題に対して、情報技術を用いて提案/解決する」がメインである。
例えば、「自動彩色による二次元キャラの金髪化」や「妹へのケモミミ付加」、「1日で作るダメ絶対音感システム」など。これらの内容が、論文テイストで執筆されている。 (論文集みたいな感じ)


例えば、SIG2D15の「Twitter絵師のジャンル分け」について。 pixivなどのイラスト投稿サイトから発見せずに、Twitterから絵師を見つける機会が多い私のような人材には、Twitter絵師のジャンル分けは解決すべき問題だと思う。これは好みクラスタの生成にもつながる。

インターネット上で活動する数多くのイラストレーター・グラフィッカー・絵描き(以下,「絵師」と呼ぶ)の方々はしばしば自作絵の告知に Twitter を用いている.絵師の告知する絵を,絵師情報と共に収集することは人類に課せられた義務であるので,文化事業として Twitterに対してもこのような収集システムを構築する必要がある.文化事業だからしかたないね.また,絵師情報にはジャンルなどの情報が付随することが好ましい.収集だけでなく閲覧と絵師へのフィードバックは欠かすべからざる人類の責務であるが,閲覧する側のユーザーには苦手なジャンルが存在する.当然のことながら我々自身が閲覧をしたいので,SAN 値が著しく下がるような画像は,保存するだけで閲覧しないようにしたいのである.このことから,絵師を大まかにジャンル分けしておくことは,収集後の絵の閲覧をする上で重要である.はーかわいいぃぃぃぃ.
(SIG2D15の「Twitter絵師のジャンル分け」, イントロダクション)

こういう問題の種を先駆者を見て、学び、変更し 、そしてまた発信すること、これもまた楽しみであり一興。
推しとしては、やはり、論文テイストで明記されてるので再現実験がしやすい点
データさえあれば気軽に検証できるし、比較実験もしやすい。
私が日頃から論文に親しんでるからかもしれませんが、論文フォーマットなので読みやすいってのも+論文ほど文面が固くない(硬派・軟派のバランスが良い)。

情報技術こと機械学習については日進月歩で進化しているため、今読むとこの技術を今だとこの技術に置き換えたらどういう風な結果になるだろうか とかベースラインとして扱えたりするのも魅力。問題設定が楽しい。

系譜・系統

同時期に販売していた「signico」や「Pythia」も似たテイストで良さみがあります。内容が被ってもアプローチやデータセットが異なるので、また問題動機も異なったり、そしてそれを情報技術にアプローチする。好き。

終わりに

二次元を題材としておたく機械学習は、ニッチですが魅力的なです。
データ的に結果を公開することが難しいことも多いので、ブログ記事に上がりにくかったりしますが、またひそかにひそかに盛り上がるように私も応援していきたいと思う。
私も改めて読んだらこの問題設定この技術使えばより精度よくなりそうとかネタが出てきたのでどこかで

関連リンク