Baixar Greengenes 13_8: Um Guia Abrangente para Pesquisa em Ecologia Microbiana
A ecologia microbiana é o estudo das interações dos microrganismos com seu ambiente, uns com os outros e com as espécies de plantas e animais. Inclui o estudo de simbioses, ciclos biogeoquímicos, diversidade microbiana e evolução. A ecologia microbiana é um campo em rápido crescimento que tem muitas aplicações em ciência ambiental, biotecnologia, medicina, agricultura e muito mais.
Um dos principais desafios na pesquisa de ecologia microbiana é identificar, caracterizar e comparar as comunidades microbianas que habitam diferentes habitats e ecossistemas. Para fazer isso, os pesquisadores geralmente contam com o sequenciamento de genes marcadores, como o sequenciamento do gene 16S rRNA, que é um método amplamente utilizado para traçar o perfil da composição taxonômica e das relações filogenéticas das comunidades bacterianas e arqueológicas.
greengenes 13_8 download
No entanto, o sequenciamento de genes marcadores requer um banco de dados de referência confiável que contenha sequências selecionadas e taxonomias de microorganismos conhecidos. Um banco de dados de referência é essencial para atribuir nomes taxonômicos às sequências obtidas de amostras ambientais, bem como para realizar análises filogenéticas e estimativas de diversidade.
Um dos bancos de dados de referência mais populares e abrangentes para pesquisa em ecologia microbiana é genes verdes, que é um banco de dados de genes 16S rRNA completo que fornece uma taxonomia com curadoria baseada na inferência de árvore de novo. Greengenes foi desenvolvido pela primeira vez em 2006 por DeSantis et al. e foi atualizado várias vezes desde então. A versão mais recente do greengenes é greengenes 13_8, que foi lançado em agosto de 2013 e contém 202,421 sequências bacterianas e arqueais.
Neste artigo, forneceremos um guia detalhado sobre como baixar e usar o banco de dados greengenes 13_8 para pesquisa de ecologia microbiana. Também mostraremos como usar QIIME, que é uma plataforma de bioinformática de microbioma de última geração que é extensível, gratuita, de código aberto e desenvolvida pela comunidade . O QIIME é uma das ferramentas mais utilizadas para analisar comunidades microbianas usando dados greengenes 13_8.
Como baixar e usar o banco de dados greengenes 13_8
Antes de poder usar o banco de dados greengenes 13_8 para sua análise de ecologia microbiana, você precisa baixá-lo de uma das fontes e formatos disponíveis. Você também precisa ter alguns pré-requisitos e requisitos para baixar e usar o banco de dados greengenes 13_8.
Pré-requisitos e requisitos
Para baixar e usar o banco de dados greengenes 13_8, você precisa ter:
Um computador com espaço de armazenamento suficiente (pelo menos 10 GB) e memória (pelo menos 4GB)
Uma conexão de internet estável
Um navegador da Web compatível com o download de arquivos grandes (como Chrome, Firefox ou Safari)
Um software que pode extrair arquivos compactados (como 7-Zip, WinRAR ou Unzip)
Um software que pode ler e editar arquivos de texto (como Notepad, WordPad ou TextEdit)
Um software que pode executar scripts e comandos QIIME (como Python, Anaconda ou Miniconda)
Se você não tiver esses pré-requisitos e requisitos, precisará instalá-los antes de prosseguir para as próximas etapas.
Como baixar o banco de dados greengenes 13_8 de diferentes fontes e formatos
O banco de dados Greengenes 13_8 está disponível para download em diferentes fontes e formatos. Dependendo de suas preferências e necessidades, você pode escolher uma das seguintes opções:
Fonte
Formatar
Descrição
Tamanho
URL
Site da Greengenes
FASTA
Um arquivo de texto simples que contém as sequências de nucleotídeos dos genes 16S rRNA no banco de dados greengenes 13_8. Cada sequência possui um identificador único e uma anotação taxonômica.
1,2 GB
(
Site da Greengenes
Newick
Um arquivo de texto simples que contém a árvore filogenética dos genes 16S rRNA no banco de dados greengenes 13_8.A árvore é baseada em um alinhamento de múltiplas sequências e uma inferência de máxima verossimilhança.
1,1 GB
(
site QIIME
Arquivos formatados Greengenes
Um conjunto de arquivos formatados para análise QIIME. Eles incluem um arquivo FASTA, um arquivo Newick, um arquivo de taxonomia e um arquivo de conjunto representativo. O arquivo de taxonomia contém as anotações taxonômicas das sequências no banco de dados greengenes 13_8. O arquivo de conjunto representativo contém um subconjunto de sequências que representam cada unidade taxonômica operacional (OTU) no banco de dados greengenes 13_8.
2,5 GB
(
Site do Zenodo
artefacto QIIME2
Um arquivo binário que contém o banco de dados greengenes 13_8 formatado para análise QIIME2. Ele inclui uma tabela de recursos, dados de recursos e dados de filogenia. A tabela de recursos contém as contagens de sequências por amostra e por OTU no banco de dados greengenes 13_8. Os dados do recurso contêm as anotações taxonômicas das OTUs no banco de dados greengenes 13_8. Os dados de filogenia contêm a árvore filogenética das OTUs no banco de dados greengenes 13_8.
1,9 GB
(
Para baixar o banco de dados greengenes 13_8 de qualquer uma dessas fontes e formatos, você precisa seguir estas etapas:
Clique no URL da fonte e formato escolhidos.
Salve o arquivo no computador.
Extraia o arquivo usando o software de sua preferência.
Renomeie e mova o arquivo para o local desejado.
Abra e edite o arquivo usando o software de sua preferência.
Como usar o banco de dados greengenes 13_8 com o QIIME
O QIIME é uma ferramenta poderosa e versátil para analisar comunidades microbianas usando dados greengenes 13_8. O QIIME pode realizar várias tarefas, como controle de qualidade, seleção de OTU, atribuição taxonômica, inferência filogenética, análise de diversidade, teste estatístico e visualização.
Para usar o banco de dados greengenes 13_8 com QIIME, você precisa seguir estas etapas:
Instale o QIIME no seu computador usando um dos métodos disponíveis. Você pode usar QIIME1 ou QIIME2 dependendo de sua preferência, o banco de dados greengenes 13_8 como seu banco de dados de referência usando o parâmetro -t gg_13_8_otus/trees/99_otus.tree se você quiser usar métricas filogenéticas. Este script irá gerar um arquivo de texto que contém os valores de diversidade alfa para cada amostra.
beta_diversidade.py: Este script calcula várias métricas de diversidade beta para cada par de amostras em seu conjunto de dados usando métodos diferentes, como Bray-Curtis, Jaccard, UniFrac, etc. Você pode especificar o banco de dados greengenes 13_8 como seu banco de dados de referência usando o parâmetro -t gg_13_8_otus/trees/99_otus.tree se você quiser usar métricas filogenéticas. Este script irá gerar um arquivo de matriz de distância que contém os valores de diversidade beta para cada par de amostras.
Como gerar visualizações interativas e informativas usando dados greengenes 13_8
As visualizações são úteis para explorar, resumir e comunicar seus dados e resultados do greengenes 13_8. As visualizações podem ajudá-lo a identificar padrões, tendências, discrepâncias e relacionamentos em seus dados e resultados. As visualizações também podem ajudá-lo a apresentar e compartilhar suas descobertas com outras pessoas de maneira atraente e compreensível.
Para gerar visualizações interativas e informativas usando dados greengenes 13_8, você pode usar os seguintes scripts ou comandos QIIME:
make_imperor.py: este script cria um gráfico 3D interativo de suas amostras com base em seus valores de diversidade beta. Você pode escolher diferentes eixos, cores, formas e tamanhos para representar diferentes variáveis em seus dados. Você também pode girar, ampliar e deslocar o gráfico para explorar diferentes perspectivas. Este script irá gerar um arquivo HTML que contém o gráfico 3D interativo.
make_otu_heatmap.py: este script cria um mapa de calor de suas amostras com base nos valores da tabela OTU.Você pode escolher diferentes cores, escalas e métodos de agrupamento para representar diferentes aspectos de seus dados. Você também pode passar o mouse sobre as células para ver os IDs e contagens de OTU. Este script irá gerar um arquivo HTML que contém o mapa de calor.
resume_taxa_through_plots.py: este script cria uma série de gráficos de barras de suas amostras com base em sua composição taxonômica em diferentes níveis. Você pode escolher diferentes cores, rótulos e métodos de classificação para representar diferentes recursos de seus dados. Você também pode clicar nas barras para ver os nomes taxonômicos e porcentagens. Este script irá gerar um arquivo HTML que contém os gráficos de barras.
make_phylogeny.py: Este script cria uma árvore filogenética de suas OTUs com base em suas sequências de banco de dados greengenes 13_8. Você pode escolher diferentes cores, rótulos e comprimentos de ramificação para representar diferentes atributos de seus dados. Você também pode clicar nos nós para ver os IDs de OTU e anotações taxonômicas. Este script irá gerar um arquivo HTML que contém a árvore filogenética.
Conclusão
Neste artigo, fornecemos um guia abrangente sobre como baixar e usar o banco de dados greengenes 13_8 para pesquisa de ecologia microbiana. Também mostramos como usar o QIIME, que é uma plataforma de bioinformática de microbioma de última geração que é extensível, gratuita, de código aberto e desenvolvida pela comunidade.
Cobrimos os seguintes tópicos:
O que é o download do greengenes 13_8 e por que ele é útil para a pesquisa em ecologia microbiana?
Quais são as principais características e vantagens do download do greengenes 13_8?
Como baixar e usar o banco de dados greengenes 13_8 de diferentes fontes e formatos?
Como usar o banco de dados greengenes 13_8 com o QIIME?
Como interpretar e visualizar dados greengenes 13_8?
Esperamos que este artigo tenha ajudado você a entender e apreciar o valor do download do greengenes 13_8 e do QIIME para pesquisa em ecologia microbiana.Também esperamos que este artigo tenha inspirado você a explorar e analisar suas próprias comunidades microbianas usando essas ferramentas.
Se você quiser saber mais sobre o download do greengenes 13_8 e o QIIME, aqui estão algumas dicas e recursos para aprendizado e exploração adicionais:
Visite os sites oficiais da greengenes e da QIIME para obter mais informações, documentação, tutoriais e suporte.
Leia as publicações originais de greengenes e QIIME para mais detalhes, métodos e resultados.
Junte-se às comunidades online de greengenes e QIIME para mais discussões, perguntas e respostas.
Explore os repositórios online de greengenes e QIIME para mais dados, códigos e exemplos.
Siga as últimas notícias e atualizações da greengenes e da QIIME nas redes sociais, como Twitter, Facebook e YouTube.
perguntas frequentes
Aqui estão algumas perguntas frequentes sobre o download do greengenes 13_8 e o QIIME:
Quais são alguns bancos de dados alternativos ao greengenes 13_8 para pesquisa de ecologia microbiana?
Alguns bancos de dados alternativos ao greengenes 13_8 para pesquisa de ecologia microbiana são:
SILVA: Um banco de dados abrangente de sequências de RNA ribossômico (rRNA) verificadas e alinhadas de qualidade dos domínios Bacteria, Archaea e Eukarya.
RDP: Um banco de dados com curadoria de sequências de genes 16S rRNA alinhadas e informações taxonômicas associadas de Bacteria e Archaea.
EZBioCloud: Uma plataforma baseada na web que fornece acesso integrado a vários recursos microbiológicos, como sequências de genes 16S rRNA, genomas, metagenomas e taxonomias.
Como atualizar o banco de dados greengenes 13_8 com novas sequências e taxonomias?
Para atualizar o banco de dados greengenes 13_8 com novas sequências e taxonomias, você precisa seguir estas etapas:
Baixe a versão mais recente do banco de dados greengenes 13_8 no site da greengenes.
Baixe as novas sequências e taxonomias que deseja adicionar ao banco de dados greengenes 13_8 de outras fontes, como NCBI , GenBank ou EMBL .
Formate as novas sequências e taxonomias de acordo com as especificações do banco de dados greengenes 13_8.
Mescle as novas sequências e taxonomias com o banco de dados greengenes 13_8 existente usando um software como MOTHUR, VSEARCH ou USEARCH.
Reconstrua a árvore filogenética do banco de dados greengenes 13_8 atualizado usando um software como FastTree , RAxML ou ClustalW .
Como lidar com variações intragenômicas e quimeras em dados greengenes 13_8?
A variação intragenômica refere-se à presença de múltiplas cópias do mesmo gene dentro de um único genoma que diferem em suas sequências de nucleotídeos. As quimeras referem-se às sequências artificiais que resultam da junção errônea de duas ou mais sequências diferentes durante a amplificação ou sequenciamento por PCR. Tanto a variação intragenômica quanto as quimeras podem introduzir ruído e viés nos dados de greengenes 13_8 e afetar a precisão e a confiabilidade da análise de ecologia microbiana.
Para lidar com variação intragenômica e quimeras em dados greengenes 13_8, você precisa seguir estas etapas:
Detecte e remova sequências quiméricas de suas amostras usando um software como UCHIME, VSEARCH ou USEARCH.
Detecte e remova variantes intragenômicas de suas amostras usando um software como DADA2, Deblur ou UNOISE.
Escolha OTUs de suas amostras usando um software como UCLUST, VSEARCH ou USEARCH.
Atribua taxonomia às suas OTUs usando um software como BLAST, RDP ou SortMeRNA.
Realize análises filogenéticas e estimativas de diversidade usando suas OTUs usando um software como QIIME, MOTHUR ou Phyloseq.
Como comparar dados de greengenes 13_8 com outras fontes de dados microbianos, como metagenômica ou metatranscriptômica?
Metagenômica é o estudo dos genomas coletivos de microorganismos em uma amostra ambiental. Metatranscriptômica é o estudo das transcrições coletivas de microorganismos em uma amostra ambiental.Tanto a metagenômica quanto a metatranscriptômica podem fornecer informações complementares aos dados dos genes verdes 13_8, como genes funcionais, vias metabólicas, expressão gênica, etc.
Para comparar os dados greengenes 13_8 com outras fontes de dados microbianos, como metagenômica ou metatranscriptômica, você precisa seguir estas etapas:
Baixe ou gere dados metagenômicos ou metatranscriptômicos de suas amostras usando um software como MG-RAST , MetaPhlAn ou KEGG .
Processe e anote seus dados metagenômicos ou metatranscriptômicos usando um software como HUMAnN , MetaCyc ou eggNOG .
Integre e compare seus dados greengenes 13_8 com seus dados metagenômicos ou metatranscriptômicos usando um software como QIIME2, STAMP ou LEfSe.
Como citar o banco de dados greengenes 13_8 e QIIME em publicações acadêmicas?
Se você usa o banco de dados greengenes 13_8 e QIIME em suas publicações acadêmicas, você precisa citá-los adequadamente e reconhecer seus autores e colaboradores. Aqui estão alguns exemplos de como citar o banco de dados greengenes 13_8 e QIIME em diferentes estilos de citação:
Estilo APA: DeSantis, T.Z., Hugenholtz, P., Larsen, N., Rojas, M., Brodie, E.L., Keller, K., ... & Andersen, G.L. (2006). Greengenes, um banco de dados de genes 16S rRNA verificado por quimera e bancada de trabalho compatível com ARB. Microbiologia aplicada e ambiental, 72(7), 5069-5072. Caporaso, J.G., Kuczynski, J., Stombaugh, J., Bittinger, K., Bushman, F.D., Costello, E.K., ... & Huttley, G.A. (2010). O QIIME permite a análise de dados de sequenciamento de comunidades de alto rendimento. Métodos da natureza, 7(5), 335-336.
Estilo MLA: DeSantis, Todd Z., et al. "Greengenes, um banco de dados de genes 16S rRNA verificado por quimera e bancada de trabalho compatível com ARB." Microbiologia aplicada e ambiental 72.7 (2006): 5069-5072. Caporaso, J. Gregory, et al. "O QIIME permite a análise de dados de sequenciamento da comunidade de alto rendimento." Nature method 7.5 (2010): 335-336.
Estilo Chicago: DeSantis, Todd Z., Philip Hugenholtz, Noriko Larsen, Mireya Rojas, Eliza L.Brodie, Kristine Keller, Torben Nielsen e outros. "Greengenes, um banco de dados de genes 16S rRNA verificado por quimera e bancada de trabalho compatível com ARB." Microbiologia aplicada e ambiental 72, no. 7 (2006): 5069-5072. Caporaso, J. Gregory, Justin Kuczynski, Jesse Stombaugh, Kyle Bittinger, Frederic D. Bushman, Elizabeth K. Costello et al. "O QIIME permite a análise de dados de sequenciamento da comunidade de alto rendimento." Métodos da natureza 7, não. 5 (2010): 335-336.
0517a86e26
Kommentarer