Învățarea profundă este un cuvânt la modă în tehnologie în ultimii 6 ani și sute de lucrări de cercetare au fost publicate în fiecare săptămână cu noi tehnici pentru a rezolva diverse sarcini de procesare a limbajului natural, de înțelegere a limbajului natural și de viziune pe calculator.
Cu toate acestea, ca începător, cineva trebuie să se concentreze pe elementele de bază și trebuie să înțeleagă cum funcționează lucrurile.

Tasă: Să prezică eticheta imaginii de intrare
Abordări generale:
1)Construirea rețelelor neuronale de convoluție de la zero, astfel încât să poată detecta marginile în imagine și să ajute la clasificarea intrării
2) Învățarea prin transfer folosind modele preinstruite, cum ar fi VGG-16
Date:
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
Utilizare în timp real: Google photos
Referință:
2)Segmentarea imaginilor :
Tasă: Pentru a prezice o mască în funcție de pixel pentru fiecare obiect din imagine

Abordări generale:
1)Crearea de la zero a unei rețele neuronale de convoluție codificator-decodificator
2) Învățarea prin transfer folosind modele preinstruite precum U-net
Caz de utilizare în lumea reală: Mașini care se conduc singure
Date:
- Cityscapes
- COCO
- Indian Driving Data
3)Rezumarea textului:
Tasă: Să genereze un rezumat semnificativ al unui paragraf sau al unor articole de știri

Abordări generale:
1)Deoarece textul trebuie să fie generat, va fi nevoie de un decodor, iar pentru a codifica informațiile dintr-un anumit articol sau paragraf ar trebui să fie necesar un codificator Deci, dacă lungimea secvenței de intrare este mică, codificatorul-decodificatorul Lstm funcționează bine, în caz contrar, trebuie să se apeleze la un mecanism de atenție și la modele de transformare
2) Reglarea fină a transformatoarelor pre-antrenate pentru generarea de limbaj cu datele noastre.
Caz de utilizare în lumea reală: Inshorts
Dataets:
- Xsum
- CNN/Dailymail
4) Captionarea imaginilor:
Task: Să prezică legenda pentru o imagine dată

Aproape: Extragerea caracteristicilor din imagini folosind o rețea neuronală de convoluție și generarea legendei folosind un decodor
Dataset:
.