L’apprentissage profond un mot tendance dans la technologie pour les 6 dernières années et des centaines de documents de recherche ont été publiés chaque semaine avec de nouvelles techniques pour résoudre diverses tâches de traitement du langage naturel, de compréhension du langage naturel et de vision par ordinateur.

Cependant, en tant que débutant, il faut se concentrer sur les bases et avoir besoin de comprendre comment les choses fonctionnent.

https://blog.edugrad.com/image-classification-using-convolutional-neural-network/

Tâche : Prédire l’étiquette de l’image d’entrée

Approches générales:

1)Construire des réseaux neuronaux à convolution à partir de zéro de sorte que peut détecter les bords dans l’image et aide à classer l’entrée

2) Apprentissage par transfert en utilisant des modèles pré-entraînés comme VGG-16

Jeux de données :

  1. MNIST
  2. CIFAR-10
  3. IMAGENET
  4. SVHN
  5. DOGS vs CATS

Utilisation en temps réel : Google photos

Référence:

2)Segmentation d’images :

Tâche : Prédire un masque pixellisé pour chaque objet dans l’image

Approches générales :

1)Création d’un réseau neuronal à convolution encodeur-décodeur à partir de zéro

2) Apprentissage par transfert en utilisant des modèles pré-entraînés comme U-net

Cas d’utilisation dans le monde réel : Voitures à conduite autonome

Jeux de données:

  1. Paysages urbains
  2. COCO
  3. Données de conduite indiennes

3)Résumé de texte:

Tâche : Générer un résumé significatif de paragraphe ou d’articles de presse

https://www.youtube.com/watch?v=9PoKellNrBc

Approches générales :

1)Comme le texte doit être généré, il y aura un besoin pour un décodeur et pour coder les informations d’un article ou d’un paragraphe donné, un codeur devrait être nécessaire Donc si la longueur de la séquence d’entrée est petite Lstm codeur-décodeur fonctionne bien sinon doivent aller pour le mécanisme d’attention et les modèles de transformateurs

2) Réglage fin des transformateurs pré-entraînés pour la génération de la langue avec nos données.

Cas d’utilisation dans le monde réel : Inshorts

Jeux de données:

  1. Xsum
  2. CNN/Dailymail

4) Légende d’images:

Tâche : Prédire la légende d’une image donnée

https://github.com/danieljl/keras-image-captioning

Approches : Extraire les caractéristiques des images en utilisant un réseau neuronal à convolution et générer une légende en utilisant un décodeur

Dataset:

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.