SILVA phylotypr wrong taxo?
J’ai pris la ligne 18771 de ton fichier xlsx.xlsx du mail precedent
Cette sequence
« TGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGAGGAGGAAGGCATAAAGGTTAATAACCTTTGTGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGCGCTTAACGTGGGAACTGCATTTGAAACTGGCAAGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAAC
«
Est classé dans ce tableau comme :
Bacteria Proteobacteria Gammaproteobacteria Enterobacteriales Enterobacteriaceae Yersinia
Flaggué comme SILVA_Phylotypr
Je l’ai reprise dans phylotypr
Avec ce code
db_silva <- build_kmer_database(
silva_v138_2_nr$sequence,
silva_v138_2_nr$taxonomy
)
unknown <- "TGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGAGGAGGAAGGCATAAAGGTTAATAACCTTTGTGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGCGCTTAACGTGGGAACTGCATTTGAAACTGGCAAGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAAC"
classify_sequence(unknown = unknown, database = db_silva) |>
filter_taxonomy() |>
print_taxonomy()
"Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"
J’ai bien un Pseudomonadota au lieu d’un Proteobacteria en phylum, c’est donc bien la bonne classification
J’ai recherché tous les Yersinia dans le fichier que je t’ai envoyé :
> open16S_tax_silva %>% filter(grepl("Yersinia\\(",classification)) %>% head %>% pull(classification)
[1] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"
[2] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"
[3] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(99);Yersinia(94)"
[4] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"
[5] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"
[6] "Bacteria(100);Pseudomonadota(100);Gammaproteobacteria(100);Enterobacterales(100);Yersiniaceae(100);Yersinia(100)"
et je trouve bien que les Yersinia sont assignés à Pseudomonadota
par ailleurs, si je recherche « Firmicutes » (qui est de l’ancienne taxo, et dans ton precedent email)
> open16S_tax_silva %>% filter(grepl("Firmicutes",classification))
[1] id sequence comment classification
<0 lignes> (ou 'row.names' de longueur nulle)
On trouve bien des Bacillota à la place
> open16S_tax_silva %>% filter(grepl("Bacillota",classification)) %>% head %>% pull(classification)
[1] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Leuconostoc(100)"
[2] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Weissella(100)"
[3] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Leuconostoc(100)"
[4] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Lactobacillaceae(100);Leuconostoc(100)"
[5] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Streptococcaceae(100);Lactococcus(99)"
[6] "Bacteria(100);Bacillota(100);Bacilli(100);Lactobacillales(100);Streptococcaceae(100);Lactococcus(100)"
le fichier open16S_tax_silva contient bien la nouvelle taxonomie silva 138.2