Modern artificial neural networks are fundamental to technologies that recognize images, interpret language, and support automated decision-making. But how do these systems actually learn? This project investigates whether different training strategies, including traditional gradient-based optimization and algorithms inspired by evolutionary processes, enable networks to develop distinct forms of “reasoning” and “behavior.” Through carefully controlled experiments and interpretability techniques, we analyze the internal workings of these models to uncover what occurs inside the “black box.” Our primary objective is to determine whether and how the choice of training method impacts the performance and behavioral characteristics of neural networks. Insights from this work could inform the design of more dependable, transparent, and human values-aligned artificial intelligence systems.
Os serviços deste site podem conter links para outros sites ou serviços on-line que são operados e mantidos por terceiros e que não estão sob controle ou são mantidos pelo Instituto Serrapilheira.
Os artigos deste site podem incluir conteúdo incorporado de outros sites.
O site armazena as informações pessoais que os usuários registram em nosso site as quais só podem ser acessadas e editadas pelos administradores do site.
O usuário pode solicitar que apaguemos todos os dados pessoais que mantemos sobre ele. Isso não inclui nenhum dado que somos obrigados a manter para fins administrativos, legais ou de segurança.
Nenhum dado sobre os visitantes que se inscrevem no site é negociado pelo Instituto Serrapilheira, sob nenhuma circunstância.
O Instituto Serrapilheira pode decidir alterar a sua política de uso de dados a qualquer momento e por sua exclusiva deliberação.