Modelos Preditivos

A análise preditiva evoluiu para um dos principais tópicos de pesquisas no mundo, sendo prioridade na agenda de muitas organizações, além de ser considerada um divisor de águas na economia. Pesquisadores em diversas disciplinas têm cada vez mais identificado oportunidades de explorar dados de formas inovadoras e diferentes, o que impulsionou essa abordagem para outras áreas de conhecimento. A modelagem preditiva possui um grande número de aplicações em quase todas as áreas da atividade humana, começando pela medicina, marketing, logística, bancos e muitos outros. A partir dos anos 2000, a área de Recursos Humanos começou também a fazer uso dessa poderosa abordagem para obtenção de informações e resolução de problemas.
Desde que o trabalho em mineração de processos começou, em meados da década de 1990, o objetivo tem sido principalmente apoiar a análise retrospectiva, por exemplo, construindo representações visuais de processos de negócios a partir de dados ou verificando se os processos são executados conforme pretendido. Com a crescente popularidade da análise preditiva, surgiu o interesse no uso de mineração de processos para analisar não apenas o passado, mas também o presente e o futuro para obter uma visão abrangente de um processo. Monitorar instâncias de processos de negócios e prever seu comportamento futuro podem permitir que os gerentes atuem de forma proativa na antecipação de eventos.
Acredita-se que haja uma compensação entre a interpretabilidade e a precisão de um modelo. Isso vem da observação de que os modelos mais elásticos geralmente têm maior precisão, mas, por sua vez, também são mais complexos, ou seja, um grande número de parâmetros do modelo que afetam a previsão final.

Problemas de Negócios em Gestão de Pessoas

Antes de discorrer sobre modelos preditivos em People Analytics, é importante discutir sobre quais são as aplicações adequadas dessas ferramentas dentro do contexto aqui apresentado. Tendo como principal objetivo a resolução de problemas de negócios relacionados a pessoas, é possível elencar algumas perguntas de partida, como:
● Quais são os principais desafios de pessoas que estão afetando a habilidade da empresa de executar seus objetivos e estratégias?
● Como o viés sistemático é expresso dentro da empresa? Como é possível agir sobre isso?
● Como serão conectadas as atividades do RH com as estratégias do negócio?
● O que conduz o engajamento, performance e produtividade dos colaboradores?
● Quais problemas e barreiras organizacionais estão impedindo os colaboradores de performar da melhor maneira possível?
● Quais iniciativas do RH estão funcionando? E quais não estão?
● Como otimizar os investimentos em pessoas para aumentar os resultados da empresa?
● A organização está alinhada a objetivos claros?
● Como priorizar políticas e programas para reduzir custos, alcançando os mesmos resultados?

Todas as perguntas sugeridas acima são passíveis de resolução por meio da óptica do People Analytics, mas não necessariamente requerem a utilização de modelos preditivos. Porém, existem casos em que a obtenção de probabilidades futuras acerca de um tema traz insumos de grande relevância para a tomada de decisões, como:

● Qual o custo total no caso da perda dos profissionais com alta probabilidade de Atrito neste mês?
● Qual a comparação do valor de investimento ao acertarmos ou errarmos a escolha do nosso próximo colaborador?
● Quem é a escolha mais provável para assumir posições de liderança? Qual o investimento de carreira adequado para o ritmo de crescimento da nossa força de trabalho?

As perguntas acima estão relacionadas, respectivamente, a três tópicos dentro da área de gestão de pessoas: turnover (attrition, ou rotatividade), sucesso no recrutamento e crescimento profissional. Dentre os diversos tópicos passíveis de aplicação do People Analytics, esses são excelentes candidatos para a utilização de análises preditivas, uma vez que podem ser transformados em problemas de classificação com uma certa segurança/facilidade.
Além das aplicações supracitadas, existem muitas outras possibilidades no contexto da utilização de dados para a tomada de decisões além das relacionadas à classificação.
Processamento de Linguagem Natural, Correlação e Agrupamento são ótimos exemplos de métodos para a obtenção de informações sem necessariamente lançar mão de predição. É importante frisar que prever nem sempre é (e em alguns casos, nunca será) a melhor estratégia de mineração dos dados.

Escolhendo o Modelo Preditivo Adequado

Como os problemas de classificação em gestão de pessoas são bastante discutidos e aplicados, é possível colocá-los como bons exemplos de utilização dos modelos preditivos. Sendo assim, existem várias possibilidades interessantes para abordar esse tipo de problema, que serão apresentadas a seguir. Em tempo, assume-se que um extenso e fundamental trabalho de aquisição e tratamento dos dados já foi previamente feito, uma vez que não existem bons resultados preditivos sem boas bases de dados. A frase “trash in, trash out” deve ser lembrada sempre. Assim, serão sugeridos modelos preditivos de regressão e classificação, ambos representando os algoritmos de aprendizado de máquina supervisionado.
Enquanto a regressão linear é destinada para a análise de variáveis contínuas, a regressão logística é utilizada para estimar a probabilidade associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias, em que a variável dependente é de natureza binária. É uma técnica que fornece alto grau de confiabilidade,
além de requerer um pequeno número de suposições, tornando-se uma escolha confortável para problemas de classificação.
Como primeiro representante dos modelos de classificação, é possível citar as Árvores de Decisão. A estrutura de uma árvore consiste em, basicamente, três elementos:
nós internos, que correspondem às verificações a serem feitas (testes) nos atributos; arestas, que representam o resultado dos testes feitos; as folhas (ou nós terminais), que contêm os rótulos a serem atribuídos a cada amostra. O processo de aprendizagem e aplicação de árvores de decisão são rápidos e simples, e apresentam (de modo geral) boa acurácia, além de serem modelos que conseguem trabalhar com dados de alta dimensão,
ou seja, grande número de atributos.
Outro modelo interessante para os problemas apresentados é o Classificador Bayesiano. Esse algoritmo é capaz de prever a probabilidade de uma amostra pertencer a uma dada classe, baseando-se no Teorema de Bayes. Os classificadores do tipo Naïve Bayes supõem que o efeito que um atributo tem na determinação da classe da amostra é independente dos demais. Alguns estudos mostram que classificadores Bayesianos Ingênuos (Naïve Bayes) apresentam desempenho equivalente ao de árvores de decisão e de alguns tipos de redes neurais artificiais em alguns problemas.
Por fim, para as abordagens de classificação propriamente ditas, pode-se citar o algoritmo k-NN (k-nearest neighbors, ou k vizinhos mais próximos). Aqui, a solução se dá por meio do aprendizado por analogia, em que uma amostra de teste é comparada com as de treinamento que são mais similares (menor distância) a ela. A partir destes k vizinhos mais próximos, identifica-se a classe mais comum dentre eles e associa-se tal classe à
amostra de testes sob análise. Por ser um algoritmo do tipo lazy learning (aprendizado lento), não requer nenhum treinamento antes de fazer previsões, o que o torna muito mais rápido em relação a outros algoritmos, além de possibilitar a inserção de novos dados na
série de maneira instantânea (uma vez que não é necessário treinar).
Adicionalmente, é possível utilizar Redes Neurais Artificiais (RNA) para resolver problemas de classificação. Um exemplo é o Multilayer Perceptron (MLP). De forma geral, a utilização de RNA exige um maior cuidado com escolhas de atributos e hiperparâmetros, que podem resultar em resultados muito acurados ou muito longe da realidade. No caso do MLP, quando utilizado em problemas de classificação, é necessário ajustar a camada de saída de acordo com o problema em questão. No caso do turnover, uma saída binária (“fica” ou “sai”) pode ser ajustada pela utilização de uma função sigmoide no neurônio de saída.

Conclusão

Quando se fala em People Analytics, é comum encontrar o termo análise preditiva associado. E, de fato, é uma grande vantagem estratégica ter dados estatísticos sobre o que pode acontecer e poder se preparar para isso. Entretanto, é necessário sempre utilizar algoritmos de previsão com parcimônia. Falta de conhecimento do problema de negócio, base de dados não tratada e pouco entendimento dos modelos utilizados podem resultar em conclusões fora da realidade, além de reproduzirem vieses e sugerirem padrões indesejados.
Neste artigo, foram sugeridos alguns modelos preditivos adequados para problemas de turnover, sucesso no recrutamento e crescimento profissional, que são casos bastante sólidos quando se fala em previsões dentro de gestão de pessoas. Cada um deles tem suas vantagens e desvantagens associadas, e é muito importante que um estudo aprofundado acerca do modelo escolhido seja feito antes de utilizá-lo como base para as decisões. Uma boa estratégia pode ser a utilização de ensembles, ou seja, construir um algoritmo com mais de um componente (Árvore de Decisão, Naïve Bayes e k-NN, por exemplo), a fim de obter um resultado final com maior capacidade de generalização e minimização de erros.

Higor Gomes

Analista de People Analytics na I.Systems

Engenheiro Mecânico, e mestrando em Engenharia e Gestão do Conhecimento, pela Unicamp, especialização em Gestão Estratégica de Pessoas, atua com People Analytics na I.SystemsS.A., startup líder na aplicação de Inteligência Artificial em processos Industriais.

GitHub: https://github.com/higor-gomes93
Medium: https://higorgomes93.medium.com/

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *