Free Trial

Fórum

Análise de dados de transações bancárias - Como clusterizar os dados?

Joker_Hazard
Bólide

Saudações amigos!


Estou tentando criar um modelo que seja capaz de identificar os seguintes padrões:

- Para cada conta debitada -> Criar um Cluster por valores de transação e tipo de pagamento para verificar se há algum padrão.

 

- Para cada conta debitada -> Agrupe por valor de transação ou tipo de pagamento e conta creditada para verificar se há padrões (conta creditada mais usada)

Eu tentei todos os tipos de ferramentas de agrupamento preditivo, mas meu conjunto de dados é muito grande e sou iniciante em machine learning.

Adoraria ouvir boas ideias para envolver outras ferramentas também para que eu possa estudar.
Infelizmente não há muito conhecimento sobre essa categoria de ferramentas na internet.

Joker_Hazard_0-1649600166362.png
Vlw

6 RESPOSTAS 6
ramosfrencl
Meteoro

Topico interessante de acompanhar. Acredito que aqui seja mais um caso de conceito do que tirar duvidas.

 

Criar 2 tipos de dados como voce perguntou para iniciar uma analise é simples, porém quando voce entra no campo de "padrão" e "machine learning" é preciso ter bem definido qual conceito utilizar. Tem as ferramentas de TS (time series) para conceitos de tendencia e sazonalidade, e de preditivo para voce aplicar varias tecnicas que desejar.

 

Iniciando, eu sugiro que voce ache os valores das 2 perguntas:

 

1- Criar um Cluster por valores de transação e tipo de pagamento

No fluxo, sumarize os dados agrupando por Conta/TipoPagamento e somando os valores. Se for mais confortavel, pode usar o Transpor para criar uma coluna por tipo pagamento e seus valores, do tipo:

Conta  | TED | PIX | Cartao

01221 | 10,00 | 20.00 | 23.00

 

A partir daí, o mais importante é voce saber qual pergunta voce quer que seja respondida. Sabendo, fica mais facil direcionar qual ferramenta de analise de dados voce deve utilizar.  

 

Abs

 

André

Joker_Hazard
Bólide

Olá Andre. Obrigado pela resposta.

Sim, diria que é mais conceito e posteriormente pode ser aplicado nas ferramentas de machine learning. Diria que tende mais a ser ao termo "preditivo" do que time series (mas posso estar errado).

Sendo mais pragmático o objetivo é encontrar "patterns" nas transações de cada conta. Por exemplo, a Conta A tende a fazer mais transações nos valores X e são feitos com mais frequencia por cartão de crédito.

Dito isto, é uma falha minha pois sou apenas um estudante no conceito de machine learning e gostaria de poder usar esta oportunidade para aprender um pouco mais sobre o assunto e usando as ferramentas da plataforma que trabalho (pois não existem muitos cases sobre isso na internet)

Muito obrigado!!

Garabujo7
Alteryx
Alteryx

Olá @Joker_Hazard ,

 

A minha recomendação é primeiro você começar com investigação de dados antes criar qualquer modelagem.

Sempre precisa entender os dados e as distribuições. Aí você poderia percever o comportamento das contas, quais tem maior frequencia.

Na abba de investigação de dados tem blocos analíticos pra isso:

 

Garabujo7_1-1649703432860.png

 

O resumo do campo é simples e dá muito informação para conhecer seus dados. Mesmo como o histograma e a análise de associação.

 

Você pode dar uma olhada nestes treinamentos de graça na Academia do Alteryx.

Comece com Investigação de dados - conceitos, segue com  Investigação de dados - técnicas

 

Garabujo7_0-1649703312016.png

 

Caso tiver mais peguntas, fique a vontade de fazer.

 

Gabriel

 

ramosfrencl
Meteoro

Olha que otima sugestão do @Garabujo7 .

 

Também vou acompanhar com atenção esse topico! 

 

dougperez
Quasar

Opa,

 

Vou acompanhar esse tópico também!!

Joker_Hazard
Bólide

Pessoal estou estudando os videos, mas acho que não vou conseguir sair do lugar com esse case por se tratar de algo bem complexo. Vou ficar acompanhando aqui caso algum gênio consiga nos ajudar neste tópico. 

Obrigado a todos!

Rótulos