L’apprentissage profond un mot tendance dans la technologie pour les 6 dernières années et des centaines de documents de recherche ont été publiés chaque semaine avec de nouvelles techniques pour résoudre diverses tâches de traitement du langage naturel, de compréhension du langage naturel et de vision par ordinateur.
Cependant, en tant que débutant, il faut se concentrer sur les bases et avoir besoin de comprendre comment les choses fonctionnent.
Tâche : Prédire l’étiquette de l’image d’entrée
Approches générales:
1)Construire des réseaux neuronaux à convolution à partir de zéro de sorte que peut détecter les bords dans l’image et aide à classer l’entrée
2) Apprentissage par transfert en utilisant des modèles pré-entraînés comme VGG-16
Jeux de données :
- MNIST
- CIFAR-10
- IMAGENET
- SVHN
- DOGS vs CATS
Utilisation en temps réel : Google photos
Référence:
2)Segmentation d’images :
Tâche : Prédire un masque pixellisé pour chaque objet dans l’image
Approches générales :
1)Création d’un réseau neuronal à convolution encodeur-décodeur à partir de zéro
2) Apprentissage par transfert en utilisant des modèles pré-entraînés comme U-net
Cas d’utilisation dans le monde réel : Voitures à conduite autonome
Jeux de données:
- Paysages urbains
- COCO
- Données de conduite indiennes
3)Résumé de texte:
Tâche : Générer un résumé significatif de paragraphe ou d’articles de presse
Approches générales :
1)Comme le texte doit être généré, il y aura un besoin pour un décodeur et pour coder les informations d’un article ou d’un paragraphe donné, un codeur devrait être nécessaire Donc si la longueur de la séquence d’entrée est petite Lstm codeur-décodeur fonctionne bien sinon doivent aller pour le mécanisme d’attention et les modèles de transformateurs
2) Réglage fin des transformateurs pré-entraînés pour la génération de la langue avec nos données.
Cas d’utilisation dans le monde réel : Inshorts
Jeux de données:
- Xsum
- CNN/Dailymail
4) Légende d’images:
Tâche : Prédire la légende d’une image donnée
Approches : Extraire les caractéristiques des images en utilisant un réseau neuronal à convolution et générer une légende en utilisant un décodeur
Dataset:
.