ディープラーニングは、過去6年間テクノロジーのトレンドワードであり、毎週、様々な自然言語処理、自然言語理解、コンピュータビジョンのタスクを解決する新しい技術について何百もの研究論文が発表されてきました。
しかし、初心者のうちは基本的なことに集中し、物事の仕組みを理解する必要があります。
Task: 入力画像のラベルを予測する
一般的なアプローチ:
1) 画像のエッジを検出できるように、ゼロから畳み込みニューラルネットワークを構築し、入力の分類に役立つ
2) VGG-16 など事前に学習したモデルを使った転移学習
データセット。
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
リアルタイムでの使用例です。 Google photos
Reference:
2)Image Segmentation :
タスク.Image Segmentation :
Task: 画像中の各オブジェクトに対してピクセル単位のマスクを予測する
Approaches.Of.Pirates
232 畳み込みニューラルネットワークを用いて画像から特徴を抽出し、デコーダを用いてキャプションを生成する
データセット: