Fórum

SOLUCIONADO

Leitura de arquivo .parquet

MatheusRMelo
Átomo

Olá, pessoal da comunidade. Tudo bem?

Estou com um problema na leitura de um arquivo no formato .parquet, estou na última versão, consegui realizar a autentição do Google Cloud Storage, mas ao ler o arquivo no formato .parquet, me deparo com o seguinte erro:

 

Screenshot 2025-03-30 214604.png

Alguém sabe como resolver ou o que pode ser o motivo do erro apresentado na ferramenta?

2 RESPOSTAS 2
kendi
Bólide

Fala @MatheusRMelo ,tudo bem?

 

Cara sendo bem sincero com você nunca mexi com Parquet no Alteryx (nem fora dele lkk).

Mas olhando a documentação tem alguns pontos importantes:

https://help.alteryx.com/current/pt/designer/data-sources/parquet-file-format.html#-en--parquet-file...

  • Versão do Designer: parquet só passou a ser opção de input a partir da versão 2024.1. Caso você tenha uma versão anterior, isso é um problema, mas não acho que seja o seu caso pelo print.
  • o AMP tem que estar ativado.
  • Na documentação está listado os tipos de Arrows suportados pelo Alteryx para Parquet. E o large_utf8, do eerro no print, não está na lista da documentação atual. Ao que me parece esse é o seu problema. Não sei qual a fonte do seu parquet, mas será que é possível extrair com um tipo que o Alteryx suporta?

 

Se precisar mande mais detalhes que o pessoal aqui tenta te ajudar.

 

Abraço,

Kendi

MatheusRMelo
Átomo

Obrigado pela ajuda, Kendi.

Conversei com o time que gerou os arquivos e descobrimos que o problema estava na formato de escrita do .parquet, aparentemente algumas formas como, por exemplo, a "zstd' ainda não podem ser utilizadas ainda, talvez em futuro próximo a Alteryx aumente para outras, existem diversas formatos de escrita e o que utilizamos não era compatível com a atual versão do Alteryx. Por exemplo, a snappy é e funcionou.

Na documentação da Alteryx mesmo tem isso:

  • Read support: Snappy and GZIP compression algorithms.

  • Write support: Snappy only.

Fonte: https://help.alteryx.com/current/pt/designer/data-sources/parquet-file-format.html##

Rótulos
Autores com maior número de soluções