O que é treinamento de modelo?

Uma das etapas do processo de criação de modelos consiste no chamado treinamento.

Resumidamente, treinar um modelo significa alimentar um algoritmo de machine learning (Regressão Logística, XGBoost, etc) com dados para que este aprenda os padrões existentes com a finalidade de fazer predições sobre novos dados. Matematicamente falando, o que o treinamento faz é: a partir dos dados de entrada, o algoritmo irá encontrar parâmetros que se ajustam adequadamente para que os erros na estimativa sejam mínimos. Treinar um modelo, na prática, significa determinar quais são estes parâmetros.

A grande eficiência de um modelo no mundo dos negócios não está necessariamente ligado com boas métricas em um conjunto de dados específicos. Um bom modelo deve ser capaz de fazer boas predições com novos dados.

Para isso, o sistema separa os dados de entrada em 3 partes: treino, validação e teste, com cerca de 70% dos dados para o treino, 20% para validação e 10% para teste. Com essa separação, o sistema ajusta os parâmetros citados acima com o treino e a validação e o conjunto de teste é separado para que este simule a entrada de novos dados. Depois que os parâmetros são escolhidos, se finaliza a parte de treinamento do modelo.



Para realizar o treinamento do modelo, você deverá selecionar:

Para saber mais sobre cada item que deverá ser selecionado, clique nos links da lista acima.

Nesta etapa também é possível visualizar a lista das variáveis incluídas ou não no treinamento do modelo. Para ver as selecionadas, clique em "Variáveis Selecionadas" na aba da lista e para visualizar as variáveis que não foram selecionadas para o treinamento clique em "Variáveis Não Selecionadas". Se alguma variável foi selecionada incorretamente ou não foi incluída para o treinamento, clique em "VOLTAR" para a etapa de visualização de variáveis e faça as alterações necessárias.

Após selecionar as opções desejadas e verificar a lista das variáveis que farão parte do treinamento do modelo, caso esteja tudo certo, clique em "TREINAR". Enquanto o modelo é treinado você poderá realizar outras atividades dentro da plataforma e assim que o processo for concluído, você receberá uma notificação.

Depois de realizar o treinamento do modelo, siga para a próxima etapa: Analisando o modelo treinado.