Nos últimos anos, o aprendizado de máquina se aproximou cada vez mais do usuário final, como é no caso do Facebook e do Google Photos, no sistema de reconhecimento de fotos e rostos, capaz de identificar quem aparece na imagem com o usuário e determinar até objetos da cena. Mas, de acordo com a Microsoft, a tecnologia não está nem perto de seu potencial. “Não podemos afirmar que o nosso sistema ‘ vê’ como uma pessoa faz, mas o que podemos dizer é que para tarefas muito específicas, estritamente definidas, podemos aprender a ser tão bons quanto os seres humanos”, explica Peter Lee, chefe de pesquisa da Microsoft.
Redes neurais
No mês passado, uma equipe de pesquisadores da companhia desenvolveu uma nova abordagem, chamada “deep residual network”, algo como “rede profunda residual”. A nova rede é mais complexa do que as redes neurais atuais, que atualmente contam com 6 ou 7 “camadas”, podendo chegar até 30. A nova rede da Microsoft contém 152 camadas.
Cada camada é um conjunto diferente de algorimos matemáticos e, quanto mais camadas, melhor o seu desempenho. A nova rede neural é melhor em reconhecer imagens, porque consegue examinar mais recursos. “Há um monte de detalhes sutis que ela pode aprender”, diz Lee [EXPLICAR]. “De um modo geral, se você fizer as redes mais profundas, torna-se mais fácil para elas aprender”, explica Alex Berg, um pesquisador da Universidade da Carolina do Norte.
De acordo com a Microsoft, no futuro a tecnologia poderá ser utilizada para melhorar o reconhecimento de imagem e outros serviços de inteligência artificial, como o reconhecimento de fala e até a linguagem falada pelos seres humanos naturalmente.