ディープラーニングは、過去6年間テクノロジーのトレンドワードであり、毎週、様々な自然言語処理、自然言語理解、コンピュータビジョンのタスクを解決する新しい技術について何百もの研究論文が発表されてきました。
しかし、初心者のうちは基本的なことに集中し、物事の仕組みを理解する必要があります。

Task: 入力画像のラベルを予測する
一般的なアプローチ:
1) 画像のエッジを検出できるように、ゼロから畳み込みニューラルネットワークを構築し、入力の分類に役立つ
2) VGG-16 など事前に学習したモデルを使った転移学習
データセット。
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
リアルタイムでの使用例です。 Google photos
Reference:
2)Image Segmentation :
タスク.Image Segmentation :
Task: 画像中の各オブジェクトに対してピクセル単位のマスクを予測する

一般的なアプローチ。
1)エンコーダ・デコーダの畳み込みニューラルネットワークを一から作る
2) U-netなどの事前学習済みモデルを使った転移学習
実際のユースケース。 自動運転車
データセット:
- Cityscapes
- COCO
- Indian Driving Data
3) Text Summarization:
タスク.Task: パラグラフやニュース記事の意味のある要約を生成する

General Approaches.Of.Pirates.Inc:
1) テキストを生成する必要があるため、デコーダが必要となり、与えられた記事やパラグラフから情報をエンコードするためにエンコーダが必要となる。したがって、入力シーケンス長が小さい場合はLstmエンコーダ-デコーダがうまく機能し、それ以外は注意メカニズムやトランスフォーマモデルに行く必要がある
2) 言語生成用に事前に学習したトランスフォーマと我々のデータとをファインチューニングする。
実世界での使用例。 Inshorts
データセット:
- Xsum
- CNN/Dailymail
4) Image Captioning:
タスク。 与えられた画像のキャプションを予測する

Approaches.Of.Pirates
データセット: