Învățarea profundă este un cuvânt la modă în tehnologie în ultimii 6 ani și sute de lucrări de cercetare au fost publicate în fiecare săptămână cu noi tehnici pentru a rezolva diverse sarcini de procesare a limbajului natural, de înțelegere a limbajului natural și de viziune pe calculator.

Cu toate acestea, ca începător, cineva trebuie să se concentreze pe elementele de bază și trebuie să înțeleagă cum funcționează lucrurile.

https://blog.edugrad.com/image-classification-using-convolutional-neural-network/

Tasă: Să prezică eticheta imaginii de intrare

Abordări generale:

1)Construirea rețelelor neuronale de convoluție de la zero, astfel încât să poată detecta marginile în imagine și să ajute la clasificarea intrării

2) Învățarea prin transfer folosind modele preinstruite, cum ar fi VGG-16

Date:

  1. MNIST
  2. CIFAR-10
  3. IMAGENET
  4. SVHN
  5. DOGS vs CATS

Utilizare în timp real: Google photos

Referință:

2)Segmentarea imaginilor :

Tasă: Pentru a prezice o mască în funcție de pixel pentru fiecare obiect din imagine

Abordări generale:

1)Crearea de la zero a unei rețele neuronale de convoluție codificator-decodificator

2) Învățarea prin transfer folosind modele preinstruite precum U-net

Caz de utilizare în lumea reală: Mașini care se conduc singure

Date:

  1. Cityscapes
  2. COCO
  3. Indian Driving Data

3)Rezumarea textului:

Tasă: Să genereze un rezumat semnificativ al unui paragraf sau al unor articole de știri

https://www.youtube.com/watch?v=9PoKellNrBc

Abordări generale:

1)Deoarece textul trebuie să fie generat, va fi nevoie de un decodor, iar pentru a codifica informațiile dintr-un anumit articol sau paragraf ar trebui să fie necesar un codificator Deci, dacă lungimea secvenței de intrare este mică, codificatorul-decodificatorul Lstm funcționează bine, în caz contrar, trebuie să se apeleze la un mecanism de atenție și la modele de transformare

2) Reglarea fină a transformatoarelor pre-antrenate pentru generarea de limbaj cu datele noastre.

Caz de utilizare în lumea reală: Inshorts

Dataets:

  1. Xsum
  2. CNN/Dailymail

4) Captionarea imaginilor:

Task: Să prezică legenda pentru o imagine dată

https://github.com/danieljl/keras-image-captioning

Aproape: Extragerea caracteristicilor din imagini folosind o rețea neuronală de convoluție și generarea legendei folosind un decodor

Dataset:

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.