Deplearning har været et trendord inden for teknologi i de sidste 6 år, og hundredvis af forskningsartikler er blevet udgivet hver uge med nye teknikker til at løse forskellige opgaver inden for Natural Language Processing, Natural Language Understanding og computer vision.
Men som nybegynder skal man dog være fokuseret på det grundlæggende og skal forstå, hvordan tingene fungerer.
Opgave:
Generelle fremgangsmåder:
1) Opbygning af konvolutionsneurale netværk fra bunden, så de kan registrere kanter i billedet og hjælpe med at klassificere input
2) Overførselslæring ved hjælp af forud trænede modeller som VGG-16
Datasæt:
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
Realtids-anvendelse: Google photos
Reference:
2)Billedsegmentering :
Task: At forudsige en pixelvis maske for hvert objekt i billedet
Generelle fremgangsmåder:
1)Oprettelse af et encoder-decoder-foldningsneuronalt netværk fra bunden
2) Overførselsindlæring ved hjælp af forud trænede modeller som U-net
Anvendelsestilfælde i den virkelige verden: Selvkørende biler
Datasæt:
- Cityscapes
- COCO
- Indian Driving Data
3)Sammenfatning af tekst:
Opgave: Sammenfatning af tekst:
Task: At generere et meningsfuldt resumé af afsnit eller nyhedsartikler
Generelle fremgangsmåder: Generelle fremgangsmåder:
1)Da tekst skal genereres, vil der være behov for en dekoder, og for at kode information fra en given artikel eller afsnit skal der kræves en koder, så hvis inputsekvenslængden er lille, fungerer Lstm-koder-dekoder godt, ellers skal man gå efter opmærksomhedsmekanisme og transformatormodeller
2) Finjustering af forud trænede transformatorer til sproggenerering med vores data.
Real-world use case: Inshorts
Datasæt:
- Xsum
- CNN/Dailymail
4) Billedtekstning:
Task: At forudsige billedteksten for et givet billede
Ansatser: Udtrække funktioner fra billeder ved hjælp af konvolution af neurale netværk og generering af billedtekst ved hjælp af en dekoder
Datasæt: