Olá pessoal,
Esta semana temos um exercício interessante que vai desafiar seus conhecimentos em muitas ferramentas do Alteryx Designer! Obtivemos acesso à sequência de RNA do SARS-CoV-2 (responsável pelo COVID-19) e gostaríamos de visualizá-lo em uma grade.
Como o RNA é composto pelos pares de bases G, T, A e C, sua exibição deve ter quatro cores. Ao criar a grade, tente classificar a sequência da esquerda para a direita; por exemplo, os primeiros pares de bases são A-T-T-A. Verifique se A é a linha 1 da coluna 1, T é a linha 1 da coluna 2 e assim por diante...
Observe que a quantidade de colunas que compõe uma linha ou as cores selecionadas dependem inteiramente de você (nossa solução possui 178 colunas)!
Se você quiser dar um passo adiante, fique à vontade para criar algo completamente novo e compartilhar conosco.
Fonte de dados: https://www.ncbi.nlm.nih.gov/nuccore/MN908947.3
Inspirado por: https://www.reddit.com/r/dataisbeautiful/comments/fkwova/oc_rna_sequence_of_covid19_this_8kb_of_data...
Acesse a solução do desafio passado e confira as contribuições de outros usuários Alteryx.
Espero que todos estejam seguros e protegidos!
Uma excelente semana pra vocês!
Bom dia!
Salve São Jorge, porque aqui no Rio é feriado e os devotos começaram a soltar fogos as 5:00....Não tem dragão que resista...
Bem, não entendo nada de genética, mas achei esse desafio bem legal pra exercitar algumas técnicas, além do assunto ser totalmente relevante.
No começo, não sabia usar a ferramenta de gráfico interativo, daí parti pra uma solução com o Matplotlib do Python, mais especificamente o meshgrid. Aí ficou assim:
Depois resolvi fuçar um pouco no Gráfico interativo e cheguei numa solução com o scatterplot.
Não sei também se é minha máquina ou a versão 2019.4, mas trabalhando com uma matriz de pontos dessa e usando o scatter plot, fica bem travado qualquer mudança no setup da ferramenta. Se alguem tiver um feedback diferente, por favor avise:
Bom fds!
Salve São Jorge @cpmonteiro!
Deve ser por isso que nossos guerreiros, resolvedores de challenges estão tão quietinhos essa semana. Teve feriado nacional na terça e hoje mais um no Rio. Aproveitem o dia!
Adorei suas duas soluções, seus fluxos ficaram bem fáceis de entender, pelo menos pelas imagens.
Vamos ver se alguém tem alguma ideia quanto ao setup da ferramenta, eu a priori não consigo pensar em nada que poderia melhorar a performance.
Até mais!
Salve São Jorge!!
@cpmonteiro Obrigada por contribuir com as suas soluções para o Desafio #12. Aliás, já estou aqui pensando que as imagens podem virar arte! 😉
Outra coisa que gostaria de sugerir, é que leve a sua questão para o Fórum para ter mais visibilidade e ver se mais alguém possa ter tido o mesmo tipo de experiência ou tem alguma recomendação.
Olá!
Encaminho minha proposta de solução.
@cpmonteiro tive a mesma experiência que você quanto à ferramenta de gráfico interativo usando o Designer 2020.1 numa máquina de 16 GB de RAM , mas ao rodar o fluxo eu recebi um aviso dizendo que matrizes acima de 10.000 linhas impactam na performance da ferramenta, então inferi que era por conta disso.
Acabei deixando de lado mexer nos parâmetros do gráfico, como é o caso das cores. Desculpem-me por estarem tão gritantes...rs
[ ]´s
Oi, bantante interesante este desafio, sou um iniciante, mas estava analisando o problema e fique com uma dúvida do problema em si, cada caracter deve ter um cor unica ou cada dupla de caracteres deve ter um cor unica?
Estou tentando criar algo, vamos ver até onde eu consigo ir?
agradeco
Filipe Quintieri
Fala Galera...
Segue e minha resolução do problema COVID 19...
Abraços à todos
Olá @filipe_quintieri,
Na verdade cada par da sequência deve ter uma combinação de cores, por exemplo A-T-T-A (dois pares) tem uma combinação de cores que é diferente da do par A-A-G-G.
Não sei se ficou claro, mas simplificando toda vez que os pares de RNA aparecerem juntos a sequência de cores será a mesma.
Acabei de postar a solução, caso precise de uma ajudinha.
Até mais!