Skip to content

SILVA phylotypr wrong taxo?

J’ai pris la ligne 18771 de ton fichier xlsx.xlsx du mail precedent

 Cette sequence

 

« TGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGAGGAGGAAGGCATAAAGGTTAATAACCTTTGTGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGCGCTTAACGTGGGAACTGCATTTGAAACTGGCAAGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAAC

« 

 

Est classé dans ce tableau comme :

 

Bacteria               Proteobacteria Gammaproteobacteria Enterobacteriales            Enterobacteriaceae        Yersinia

 

Flaggué comme SILVA_Phylotypr

 

 

 

Je l’ai reprise dans phylotypr

 

Avec ce code

 

db_silva <- build_kmer_database(

  silva_v138_2_nr$sequence,

  silva_v138_2_nr$taxonomy

)

 

unknown <- "TGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGAGGAGGAAGGCATAAAGGTTAATAACCTTTGTGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGCGCTTAACGTGGGAACTGCATTTGAAACTGGCAAGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAAC"

 

classify_sequence(unknown = unknown, database = db_silva) |>

  filter_taxonomy() |>

  print_taxonomy()

 

"Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"

 

 

J’ai bien un Pseudomonadota au lieu d’un Proteobacteria en phylum, c’est donc bien la bonne classification

 

J’ai recherché tous les Yersinia dans le fichier que je t’ai envoyé :

 

> open16S_tax_silva %>% filter(grepl("Yersinia\\(",classification)) %>% head %>% pull(classification)

[1] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"

[2] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"

[3] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(99);Yersinia(94)" 

[4] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"

[5] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"

[6] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"

 

et je trouve bien que les Yersinia sont assignés à Pseudomonadota

 

par ailleurs, si je recherche « Firmicutes » (qui est de l’ancienne taxo, et dans ton precedent email)

 

> open16S_tax_silva %>% filter(grepl("Firmicutes",classification))

[1] id             sequence       comment        classification

<0 lignes> (ou 'row.names' de longueur nulle)

 

On trouve bien des Bacillota à la place

 

> open16S_tax_silva %>% filter(grepl("Bacillota",classification)) %>% head %>% pull(classification)

[1] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Leuconostoc(100)"

[2] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Weissella(100)" 

[3] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Leuconostoc(100)"

[4] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Leuconostoc(100)"

[5] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Streptococcaceae(100);Lactococcus(99)"

[6] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Streptococcaceae(100);Lactococcus(100)"

 

 

le fichier open16S_tax_silva contient bien la nouvelle taxonomie silva 138.2