Syväoppiminen on ollut trendikäs sana teknologiassa viimeisten kuuden vuoden ajan, ja satoja tutkimusartikkeleita on julkaistu viikoittain uusilla tekniikoilla erilaisten luonnollisen kielen prosessoinnin, luonnollisen kielen ymmärtämisen ja tietokonenäön tehtävien ratkaisemiseksi.
Aloittelijana on kuitenkin keskityttävä perusasioihin ja ymmärrettävä, miten asiat toimivat.

Tehtävä: Yleisiä lähestymistapoja:
1) Konvoluutio-neuraaliverkkojen rakentaminen tyhjästä niin, että ne pystyvät havaitsemaan kuvan reunat ja auttavat luokittelemaan syötteen
2) Siirto-oppiminen käyttäen esivalmennettuja malleja, kuten VGG-16
Datasarjat:
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
Reaaliaikainen käyttö: Google photos
Reference:
2)Image Segmentation :
Task: Ennustaa pikselikohtainen maski jokaiselle kuvassa olevalle objektille

Yleisiä lähestymistapoja:
1)Enkooderi-dekooderi-konvoluutiohermoverkon luominen tyhjästä
2) Siirto-oppiminen käyttäen esivalmennettuja malleja, kuten U-verkkoa
Reaalimaailman käyttötapaus: Itsestään ajavat autot
Datasarjat:
- Cityscapes
- COCO
- Indian Driving Data
3)Tekstin tiivistäminen:
Tehtävä: Tuottaa mielekäs yhteenveto kappaleesta tai uutisartikkelista

Yleiset lähestymistavat:
1)Koska tekstiä on generoitava tarvitaan dekooderi ja koodaamaan tietoa tietystä artikkelista tai kappaleesta tarvitaan kooderi Joten jos syötesekvenssin pituus on pieni Lstm-kooderi-dekooderi toimii hyvin muuten on mentävä huomiomekanismiin ja Transformer-malleihin
2) Hienosäätö valmiiksi treenattujen transformereiden hienosäätö kielen generoimista varten datamme kanssa.
Reaalimaailman käyttötapaus: Inshorts
Dataset:
- Xsum
- CNN/Dailymail
4) Image Captioning:
Task: Ennustaa tietyn kuvan kuvateksti

Menetelmät: Ominaisuuksien poimiminen kuvista konvoluutiohermoverkon avulla ja kuvatekstin tuottaminen dekooderin avulla
Dataset: