O que é amostragem?

A amostragem é o processo de selecionar um grupo de indivíduos de uma população, a fim de estudar e caracterizar a população total.

 

A ideia é bastante simples. Imagine que você quer saber uma informação sobre um universo ou população, por exemplo, qual a porcentagem de pessoas que praticam esportes regularmente no México.

Uma maneira de obter essa informação é entrar em contato com todos os habitantes do México (122 milhões de pessoas) e perguntar se praticam atividades físicas com regularidade. A outra maneira é selecionar um subconjunto de indivíduos (por exemplo, 1.000 pessoas) e fazer a mesma pergunta. O grupo de 1.000 pessoas formam uma amostra e a maneira como eu seleciono este grupo é chamado de amostragem. A parte importante do processo de amostragem é garantir que a amostra seja uma boa representação da população.

 

No contexto de aprendizado de máquina, usamos uma amostragem para dividir nosso conjunto de dados inicial em três partes: treino, validação e teste, garantindo que as três contenham a mesma distribuição dos dados originais.