La fin du premier tutoriel, "MNIST pour les débutants en ML", contient ce paragraphe :
Ce qui compte, c'est que nous ayons appris de ce modèle. Néanmoins, si vous vous sentez un peu déprimé par ces résultats, consultez le prochain didacticiel où nous faisons beaucoup mieux et apprenez à créer des modèles plus sophistiqués à l'aide de TensorFlow !
Mais le prochain tutoriel est "Deep MNIST for Experts", et il n'explique pas les choses aussi bien que le premier tutoriel. Par exemple, le deuxième tutoriel commence à différer à la section Build a Multilayer Convolutional Network
, mais le tout premier paragraphe sous Weight Initialization
n'explique pas les concepts qu'il utilise :
Pour créer ce modèle, nous allons devoir créer beaucoup de poids et de biais. Il faut généralement initialiser les poids avec une petite quantité de bruit pour briser la symétrie et éviter les gradients 0. Puisque nous utilisons des neurones ReLU, il est également recommandé de les initialiser avec un biais initial légèrement positif pour éviter les "neurones morts". Au lieu de le faire à plusieurs reprises pendant que nous construisons le modèle, créons deux fonctions pratiques pour le faire pour nous.
Que sont les « neurones ReLU » ? Pourquoi les utilisons-nous ? Qu'est-ce qu'un réseau convolutif même ?
je dirais non plus
the next tutorial
mais plutôt a later tutorial on MNIST for Experts
.Merci!
Secondé. Je pense qu'une explication des réseaux de conv serait utile dans le contexte des chiffres MNIST.
Les didacticiels TensorFlow ne peuvent pas remplacer un manuel ou un cours d'apprentissage en profondeur ou d'apprentissage automatique. Nous pouvons ajouter des pointeurs vers des ressources supplémentaires au fur et à mesure que celles-ci deviennent disponibles.
Non seulement ce tutoriel est compliqué, mais tous ces tutoriels sont compliqués.
Par exemple, ce que je veux faire c'est :
Mais Tensorflow me donne déjà au début un tutoriel MNIST à 4 fichiers, avec des graphiques compliqués et des mécanismes compliqués pour charger des fichiers dans le réseau
Commentaire le plus utile
Non seulement ce tutoriel est compliqué, mais tous ces tutoriels sont compliqués.
Par exemple, ce que je veux faire c'est :
Mais Tensorflow me donne déjà au début un tutoriel MNIST à 4 fichiers, avec des graphiques compliqués et des mécanismes compliqués pour charger des fichiers dans le réseau