Olá, comunidade, todos bem por aí?
O desafio desta semana marca o final da trilogia de desafios inspirados no Grand Prix do Inspire 2023. Esse é o mais difícil da série, e você tem que fazer previsões. Prontos?
Desafio:
Um motorista que trabalha para a ACE foi recentemente promovido a gerente do turno diurno. Por isso, a empresa precisa reduzir o seu horário semanal de coleta de alimentos. Eles decidiram remover cinco turnos do calendário de coleta até conseguir preencher a vaga que era do motorista promovido.
No desafio, você tem que responder a seguinte pergunta: quais são os cinco turnos com maior probabilidade de não serem bem-sucedidos?
Para fazê-lo, crie um Modelo de Floresta aleatório para determinar os cinco turnos de coleta com maior probabilidade de cancelamento com base nos dados históricos de trabalho. Para o modelo de floresta, utilize apenas as colunas DistanceMiles, Hour e DayofWeek como fatores de previsão.
Para os dados de cancelamento, você precisará calcular o seguinte:
DayofWeek: O nome exato do campo, o nome completo do dia e (%A) que o trabalho ocorreu com base na Data.
JobStatus:
- Um valor de Unsuccessful (Sem êxito) se a tarefa foi cancelada.
- Um valor de Successful se a tarefa foi bem-sucedida com base nos valores de ClosedReason. Um valor Successful será qualquer ClosedReason que comece por 01 ou 02 e um valor Unsuccessful será qualquer outro valor.
Vamos lá? Bom desafio!