algonote

機械学習とか

画像処理

第41回コンピュータビジョン勉強会 感想&まとめ #cvsaisentan

第41回コンピュータビジョン勉強会(CVPR2017読み会 後編)に行ってきました。 Self-Critical Sequence Training for Image Captioning Self-Critical Sequence Training for Image Captioning (関東CV勉強会 CVPR 2017 読み会) from Yoshitaka Ushiku 強化…

【サーベイ】マンガの自動コマ分割

年々ディスプレイが大きくなっているとはいえ、スマホの画面サイズは一般的に小さく、マンガを読むには辛いことも多い。マンガは一般的に1ページがコマ単位で別れており、このコマを自動で分割できれば、再レイアウトに利用できる。 まずは既存手法にどんな…

Amazon Rekognitionで現金の出品を検知(福沢諭吉で顔認証)

前回の続きです。 ja.algonote.com 今回はAmazon Rekognitionの顔関係のAPIを試します。 顔比較について Amazon Rekognitionでは顔に関するAPIをいくつか公開しています。 Facial Analysisは顔のキーポイントの検出。笑っているかどうかなどがわかります。 F…

画像認識で現金の出品を検知する(Google vs Amazon)

例えばあなたが自作フィギュアのマーケットプレース figcari の社員だとします。 figcariは3Dプリンターの発展により絶賛急成長中ですが、最近になって規約違反の現金の出品が目立つようになりました。あなたの仕事は現在手作業でやっている仕分けを画像認識…

Deep Learningでマンガの自動翻訳(をしたかった)

日本のマンガの海外販売では以前より公式翻訳がないことに起因するファンサブ(非公式字幕)の権利問題が起きている。Deep LearningによりOCRと自動翻訳の精度が上がれば、問題が解決するかもしれない。 ブラックジャックによろしくのページをいくつかGoogle C…

マンガのPDFをJPEGに書き出す

マンガのPDFをJPEGに書き出そうとしてハマったのでメモ yonkoma2dataは普通のマンガの変換にむかない。 無料配布しているブラックジャックによろしくを機械学習に使いたいが、基本PDFでの提供なので、そのままだと何分扱いづらい。画像処理をするならPNGかJP…

Deep Learningでヒアリを検出・判定する(YOLO9000)

“殺人アリ"ことヒアリが日本に上陸したらしい。 Twitterではヒアリかどうかを判別してくれるヒアリ警察が人気だが、画像認識ではなく、中身は人間の専門家のようだ。ヒアリ警察さんも24時間365日稼働できないと思うので、Deep Learningで実装できないのか模…