A mélytanulás az elmúlt 6 évben trendi szó volt a technológiában, és hetente több száz kutatási cikk jelent meg új technikákkal a különböző természetes nyelvfeldolgozási, természetes nyelvi megértési és számítógépes látási feladatok megoldására.
Mégis kezdőként az alapokra kell koncentrálni, és meg kell érteni, hogyan működnek a dolgok.
feladat: A bemeneti kép címkéjének előrejelzése
Általános megközelítések:
1) Konvolúciós neurális hálózatok építése a semmiből, így képes érzékelni a kép éleit és segít a bemenet osztályozásában
2) Transzfer tanulás előzetesen betanított modellekkel, mint például a VGG-16
Adatkészletek:
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
Valós idejű használat:
Általános megközelítések:
1)Encoder-decoder konvolúciós neurális hálózat létrehozása a semmiből
2) Transzfer tanulás előre betanított modellekkel, mint az U-háló
Valós világbeli felhasználási eset: Adathalmazok:
- Citycapes
- COCO
- Indian Driving Data
3)Text Summarization:
Task:
Általános megközelítések:
1)Mivel szöveget kell generálni, szükség lesz egy dekóderre, és egy adott cikk vagy bekezdés információjának kódolásához kódolóra van szükség Tehát ha a bemeneti szekvencia hossza kicsi Lstm kódoló-dekóder jól működik máskülönben mennünk kell a figyelem mechanizmus és transzformátor modellek
2) Finomhangolás előre betanított transzformátorok nyelvgeneráláshoz az adatainkkal.
Real-world use case: Inshorts
Adatkészletek:
- Xsum
- CNN/Dailymail
4) Képfeliratozás:
feladat: Adott kép feliratának megjóslása
Eljárások:
Adatállomány: