Dep learning een trending woord in de technologie voor de afgelopen 6 jaar en honderden onderzoekspapers zijn elke week gepubliceerd met nieuwe technieken om verschillende Natural Language Processing, Natural Language Understanding en computer vision-taken op te lossen.
Als beginner moet men zich echter op de basis richten en begrijpen hoe dingen werken.
Taak: Het label van de inputafbeelding voorspellen
Algemene benaderingen:
1)Convolutie-neurale netwerken vanaf nul bouwen zodat randen in de afbeelding kunnen worden gedetecteerd en input kan worden geclassificeerd
2) Transfer learning met behulp van vooraf getrainde modellen zoals VGG-16
Datasets:
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
Realtime Gebruik: Google photos
Reference:
2)Image Segmentation :
Task: Een pixelgewijs masker voorspellen voor elk object in de afbeelding
Algemene Benaderingen:
1)Een encoder-decoder convolutie neuraal netwerk vanaf nul creëren
2) Transfer leren met behulp van vooraf getrainde modellen zoals U-net
Real-world use case: Zelfrijdende auto’s
Datasets:
- Stadsgezichten
- COCO
- Indiase rijgegevens
3)Tekstsamenvatting:
Taak: Het genereren van een zinvolle samenvatting van paragraaf- of nieuwsartikelen
Algemene Benaderingen:
1)Aangezien tekst moet worden gegenereerd zal er behoefte zijn aan een decoder en om informatie van een bepaald artikel of paragraaf encoder te coderen moet worden vereist Dus als de input sequentie lengte is klein Lstm encoder-decoder werkt goed anders moeten gaan voor aandacht mechanisme en Transformer modellen
2) Fine-tuning vooraf getrainde transformatoren voor taal generatie met onze gegevens.
Real-world use case: Inshorts
Datasets:
- Xsum
- CNN/Dailymail
4) Image Captioning:
Taak: Het bijschrift voor een gegeven afbeelding voorspellen
Approaches: Kenmerken uit afbeeldingen extraheren met behulp van een convolutieneuraal netwerk en bijschriften genereren met behulp van een decoder
Dataset: