O final do primeiro tutorial, "MNIST para iniciantes em ML", contém este parágrafo:
O que importa é que aprendemos com esse modelo. Ainda assim, se você estiver se sentindo um pouco desanimado com esses resultados, confira o próximo tutorial, onde nos saímos muito melhor, e aprenda como construir modelos mais sofisticados usando o TensorFlow!
Mas o próximo tutorial é "Deep MNIST for Experts" e não explica as coisas tão bem quanto o primeiro tutorial. Por exemplo, o segundo tutorial começa diferindo na seção Build a Multilayer Convolutional Network
, mas o primeiro parágrafo em Weight Initialization
não explica os conceitos que está usando:
Para criar este modelo, vamos precisar criar muitos pesos e vieses. Geralmente, deve-se inicializar os pesos com uma pequena quantidade de ruído para quebra de simetria e para evitar 0 gradientes. Como estamos usando neurônios ReLU, também é uma boa prática inicializá-los com um viés inicial ligeiramente positivo para evitar "neurônios mortos". Em vez de fazer isso repetidamente enquanto construímos o modelo, vamos criar duas funções úteis para fazer isso por nós.
O que são "neurônios ReLU"? Por que os estamos usando? O que _é_ uma rede convolucional mesmo?
Eu diria também
the next tutorial
mas sim a later tutorial on MNIST for Experts
.Obrigado!
Destacado. Acho que uma explicação das redes conv seria útil no contexto dos dígitos MNIST.
Os tutoriais do TensorFlow não podem substituir um livro ou curso de aprendizado profundo ou aprendizado de máquina. Podemos adicionar indicadores para recursos adicionais à medida que forem disponibilizados.
Não apenas este tutorial é complicado, todos esses tutoriais são complicados.
Por exemplo, o que eu quero fazer é:
Mas o Tensorflow me dá já no início um tutorial MNIST de 4 arquivos, com gráficos complicados e mecanismos complicados para carregar arquivos na rede
Comentários muito úteis
Não apenas este tutorial é complicado, todos esses tutoriais são complicados.
Por exemplo, o que eu quero fazer é:
Mas o Tensorflow me dá já no início um tutorial MNIST de 4 arquivos, com gráficos complicados e mecanismos complicados para carregar arquivos na rede