algonote

機械学習とか

【サーベイ】マンガの自動コマ分割

年々ディスプレイが大きくなっているとはいえ、スマホの画面サイズは一般的に小さく、マンガを読むには辛いことも多い。マンガは一般的に1ページがコマ単位で別れており、このコマを自動で分割できれば、再レイアウトに利用できる。

まずは既存手法にどんなものがあるか調査してみる。

画素値のピークから算出する手法

4コマ漫画では基本的にコマ位置が固定のため、パターンからの推定が可能である。 下記ブログでは水平方向の画素の合計を上から走査していき、ピーク位置を検出、コマとコマの切れ目を割り出している。 non117.hatenablog.com

コマの形状(コの字、L字)で抽出する手法

画像処理で直線を検出、直線と直線を組み合わせてコの字、L字となっている部分をコマとして算出する方法。4コマ以外にも使用できるが、直線長がある程度あることを仮定しているようなのでコマから人物がはみ出ているとつらいか。 whomor.com

コマの余白を上下左右に走査する方法

グレースケール化、2値化した後に余白を上下、左右に走査していきコマを分割する方法。ナイーブな実装だと斜めのコマは上手く検出できない。 https://shingi.jst.go.jp/past_abst/abst/p/12/1263/akita03.pdf

最大ラベリング領域を反転させる方法

1ページを領域分割していき、ラベリング。その中で最大のものを反転させてコマを切り取る方法。OpenCV 3.0からラベリング関数が追加されているのでおそらくそれを使っている。四コマでなくてもいいし、コマ区切りが斜めでもいけるので一番優秀。 nyaa.hatenadiary.jp

その他参考

論文からポスターを自動生成する論文。マンガのレイアウト作成の先行研究を参考にしている。 createwith.ai