Syväoppiminen on ollut trendikäs sana teknologiassa viimeisten kuuden vuoden ajan, ja satoja tutkimusartikkeleita on julkaistu viikoittain uusilla tekniikoilla erilaisten luonnollisen kielen prosessoinnin, luonnollisen kielen ymmärtämisen ja tietokonenäön tehtävien ratkaisemiseksi.

Aloittelijana on kuitenkin keskityttävä perusasioihin ja ymmärrettävä, miten asiat toimivat.

https://blog.edugrad.com/image-classification-using-convolutional-neural-network/

Tehtävä: Yleisiä lähestymistapoja:

1) Konvoluutio-neuraaliverkkojen rakentaminen tyhjästä niin, että ne pystyvät havaitsemaan kuvan reunat ja auttavat luokittelemaan syötteen

2) Siirto-oppiminen käyttäen esivalmennettuja malleja, kuten VGG-16

Datasarjat:

  1. MNIST
  2. CIFAR-10
  3. IMAGENET
  4. SVHN
  5. DOGS vs CATS

Reaaliaikainen käyttö: Google photos

Reference:

2)Image Segmentation :

Task: Ennustaa pikselikohtainen maski jokaiselle kuvassa olevalle objektille

Yleisiä lähestymistapoja:

1)Enkooderi-dekooderi-konvoluutiohermoverkon luominen tyhjästä

2) Siirto-oppiminen käyttäen esivalmennettuja malleja, kuten U-verkkoa

Reaalimaailman käyttötapaus: Itsestään ajavat autot

Datasarjat:

  1. Cityscapes
  2. COCO
  3. Indian Driving Data

3)Tekstin tiivistäminen:

Tehtävä: Tuottaa mielekäs yhteenveto kappaleesta tai uutisartikkelista

https://www.youtube.com/watch?v=9PoKellNrBc

Yleiset lähestymistavat:

1)Koska tekstiä on generoitava tarvitaan dekooderi ja koodaamaan tietoa tietystä artikkelista tai kappaleesta tarvitaan kooderi Joten jos syötesekvenssin pituus on pieni Lstm-kooderi-dekooderi toimii hyvin muuten on mentävä huomiomekanismiin ja Transformer-malleihin

2) Hienosäätö valmiiksi treenattujen transformereiden hienosäätö kielen generoimista varten datamme kanssa.

Reaalimaailman käyttötapaus: Inshorts

Dataset:

  1. Xsum
  2. CNN/Dailymail

4) Image Captioning:

Task: Ennustaa tietyn kuvan kuvateksti

https://github.com/danieljl/keras-image-captioning

Menetelmät: Ominaisuuksien poimiminen kuvista konvoluutiohermoverkon avulla ja kuvatekstin tuottaminen dekooderin avulla

Dataset:

Vastaa

Sähköpostiosoitettasi ei julkaista.