A mélytanulás az elmúlt 6 évben trendi szó volt a technológiában, és hetente több száz kutatási cikk jelent meg új technikákkal a különböző természetes nyelvfeldolgozási, természetes nyelvi megértési és számítógépes látási feladatok megoldására.

Mégis kezdőként az alapokra kell koncentrálni, és meg kell érteni, hogyan működnek a dolgok.

https://blog.edugrad.com/image-classification-using-convolutional-neural-network/

feladat: A bemeneti kép címkéjének előrejelzése

Általános megközelítések:

1) Konvolúciós neurális hálózatok építése a semmiből, így képes érzékelni a kép éleit és segít a bemenet osztályozásában

2) Transzfer tanulás előzetesen betanított modellekkel, mint például a VGG-16

Adatkészletek:

  1. MNIST
  2. CIFAR-10
  3. IMAGENET
  4. SVHN
  5. DOGS vs CATS

Valós idejű használat:

Általános megközelítések:

1)Encoder-decoder konvolúciós neurális hálózat létrehozása a semmiből

2) Transzfer tanulás előre betanított modellekkel, mint az U-háló

Valós világbeli felhasználási eset: Adathalmazok:

  1. Citycapes
  2. COCO
  3. Indian Driving Data

3)Text Summarization:

Task:

https://www.youtube.com/watch?v=9PoKellNrBc

Általános megközelítések:

1)Mivel szöveget kell generálni, szükség lesz egy dekóderre, és egy adott cikk vagy bekezdés információjának kódolásához kódolóra van szükség Tehát ha a bemeneti szekvencia hossza kicsi Lstm kódoló-dekóder jól működik máskülönben mennünk kell a figyelem mechanizmus és transzformátor modellek

2) Finomhangolás előre betanított transzformátorok nyelvgeneráláshoz az adatainkkal.

Real-world use case: Inshorts

Adatkészletek:

  1. Xsum
  2. CNN/Dailymail

4) Képfeliratozás:

feladat: Adott kép feliratának megjóslása

https://github.com/danieljl/keras-image-captioning

Eljárások:

Adatállomány:

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.