O aprendizado por reforço é particularmente útil em situações onde a sequência de ações é crítica, como jogos ou navegação robótica. Exemplos incluem algoritmos de Q-learning e redes neurais profundas utilizadas em sistemas como o AlphaGo. Assinale abaixo como o aprendizado por reforço difere dos outros tipos de aprendizado de máquina:

Resposta :

Outras perguntas