Antes de qualquer coisa, é necessário ter ou criar uma conta no Microsoft Azure. Caso não tenha, é só seguir esse link e criar a sua.
-
Entre no portal do Azure usando suas credenciais da Microsoft.
-
Selecione + Criar um recurso , pesquise Machine Learning e crie um novo recurso do Azure Machine Learning com as configurações abaixo:
- Assinatura: sua assinatura do Azure.
- Grupo de recursos: Crie ou selecione um grupo de recursos.
- Nome: Insira um nome exclusivo para seu espaço de trabalho.
- Região: Selecione a região geográfica mais próxima.
- Conta de armazenamento: observe a nova conta de armazenamento padrão que será criada para seu espaço de trabalho.
- Cofre de chaves: Observe o novo cofre de chaves padrão que será criado para seu espaço de trabalho.
- Insights de aplicativo: observe o novo recurso padrão de insights de aplicativo que será criado para seu espaço de trabalho.
- Registro de contêiner: Nenhum (um será criado automaticamente na primeira vez que você implantar um modelo em um contêiner).
-
Selecione Revisar + criar e selecione Criar. Aguarde a criação do seu espaço de trabalho (pode demorar alguns minutos) e, em seguida, vá para o recurso implantado.
-
Selecione Launch Studio (ou abra uma nova guia do navegador e navegue até https://ml.azure.com e entre no Azure Machine Learning Studio usando sua conta da Microsoft). Feche todas as mensagens exibidas.
-
No estúdio Azure Machine Learning, você deverá ver seu espaço de trabalho recém-criado. Caso contrário, selecione Todos os espaços de trabalho no menu à esquerda e selecione o espaço de trabalho que você acabou de criar.
-
No Azure Machine Learning Studio, veja a página ML Automatizado.
-
Crie um novo trabalho de ML automatizado com as seguintes configurações, avançando quando necessário pela interface do usuário:
- Nome do trabalho: mslearn-bike-automl
- Novo nome do experimento: mslearn-bike-rental
- Descrição: Aprendizado de máquina automatizado para previsão de aluguel de bicicletas
- Marcadores: nenhum
-
Selecione o tipo de tarefa: Regressão
-
Selecionar conjunto de dados: crie um novo conjunto de dados com as seguintes configurações:
-
Tipo de dados:
- Nome: aluguel de bicicletas
- Descrição: dados históricos de aluguel de bicicletas
- Tipo: Tabular
-
Fonte de dados:
- Selecione Dos arquivos da web.
-
URL da Web:
- URL da Web: https://aka.ms/bike-rentals
- Ignorar validação de dados: não selecionar
-
Configurações:
- Formato de arquivo: Delimitado
- Delimitador: Vírgula
- Codificação: UTF-8s
- Cabeçalhos de coluna: Apenas o primeiro arquivo possui cabeçalhos
- Pular linhas: Nenhum
- O conjunto de dados contém dados multilinhas: Não selecione
-
Esquema:
- Incluir todas as colunas exceto Caminho
- Revise os tipos detectados automaticamente
-
- Selecione o conjunto de dados de aluguel de bicicletas depois de criá-lo.
-
Tipo de tarefa: Regressão
-
Conjunto de dados: aluguel de bicicletas
-
Coluna de destino: Aluguéis (inteiro)
-
Configurações adicionais:
- Métrica primária: raiz do erro quadrático médio normalizado
- *Explique o melhor modelo : Não selecionado
- Usar todos os modelos suportados: Desmarcado . Você restringirá o trabalho para tentar apenas alguns algoritmos específicos.
- Modelos permitidos: Selecione apenas RandomForest e LightGBM — normalmente você gostaria de tentar o máximo possível, mas cada modelo adicionado aumenta o tempo necessário para executar o trabalho.
-
Expanda a seção Limites.
- Máximo de testes: 3
- Máximo de testes simultâneos: 3
- Máximo de nós: 3
- Limite de pontuação da métrica: 0,85 (para que, se um modelo atingir uma pontuação da métrica de erro quadrático médio normalizado de 0,085 ou menos, o trabalho termina.)
- Tempo limite: 15
- Tempo limite de iteração: 5
- Habilitar rescisão antecipada: selecionado
-
Validação e teste:
- Tipo de validação: divisão de validação de trem
- Porcentagem de dados de validação: 10
- Conjunto de dados de teste: Nenhum
- Selecione o tipo de computação: sem servidor
- Tipo de máquina virtual: CPU
- Camada de máquina virtual: Dedicada
- Tamanho da máquina virtual: Standard_DS3_V2
- Número de instâncias: 1
-
Envie o trabalho de treinamento. Ele inicia automaticamente.
-
Aguarde o trabalho ser concluído.
Quando o trabalho automatizado de aprendizado de máquina for concluído, você poderá revisar o melhor modelo treinado.
-
Na guia Visão geral do trabalho automatizado de aprendizado de máquina, observe o melhor resumo do modelo.
-
Selecione o texto em Nome do algoritmo do melhor modelo para visualizar seus detalhes.
-
Selecione a guia Métricas e selecione os gráficos residuais e predito_true se eles ainda não estiverem selecionados.
Revise os gráficos que mostram o desempenho do modelo. O gráfico de resíduos mostra os resíduos (as diferenças entre os valores previstos e reais) como um histograma. O gráfico predito_true compara os valores previstos com os valores verdadeiros.
- Na guia Modelo do melhor modelo treinado pelo seu trabalho automatizado de machine learning, selecione Implantar e use a opção de serviço Web para implantar o modelo com as seguintes configurações:
- Nome: prever-aluguéis
- Descrição: Prever aluguel de bicicletas
- Tipo de computação: Instância de Contêiner do Azure
- Habilitar autenticação: selecionado
-
Aguarde o início da implantação – isso pode levar alguns segundos. O status de implantação do endpoint de previsão de aluguel será indicado na parte principal da página como Running.
-
Aguarde até que o status da implantação mude para Succeeded. Isso pode levar de 5 a 10 minutos.
-
No estúdio Azure Machine Learning, no menu esquerdo, selecione Endpoints e abra o ponto final em tempo real de previsão de alugueres.
-
Na página do endpoint em tempo real de previsão de aluguel, visualize a guia Teste.
-
No painel Dados de entrada para testar o endpoint, substitua o modelo JSON pelos seguintes dados de entrada:
{
"Inputs": {
"data": [
{
"day": 1,
"mnth": 1,
"year": 2022,
"season": 2,
"holiday": 0,
"weekday": 1,
"workingday": 1,
"weathersit": 2,
"temp": 0.3,
"atemp": 0.3,
"hum": 0.3,
"windspeed": 0.3
}
]
},
"GlobalParameters": 1.0
}
-
Clique no botão Testar .
-
Revise os resultados do teste, que incluem um número previsto de aluguéis com base nos recursos de entrada - semelhante a este:
{
"Results": [
356.9253888264152
]
}