Clarifications concernant l'export MIAPPE
J'ai commencé à travailler sur l'export MIAPPE, mais j'ai plein de questions. Merci de bien vouloir y répondre.
Question 1: Faut-il exporter au format Excel uniquement, ou bien aussi en CSV comme les autres exports?
Question 2: Est-on bien d'accord que les champs à exporter sont ceux de la section "Biological Material", décrit à la page https://github.com/MIAPPE/MIAPPE/blob/master/Mapping/MIAPPE_Checklist_Mapping.tsv, i.e. les champs qui vont de la ligne 43 à la ligne 59?
Question 3: Quel doit être le titre de chaque colonne du fichier Excel généré? Est-ce bien le contenu de la première colonne (MIAPPE) de la page https://github.com/MIAPPE/MIAPPE/blob/master/Mapping/MIAPPE_Checklist_Mapping.tsv?
Question 4:
La provenance des données est parfois /germplasm/{germplasmDbId}, et parfois /germplasm/{germplasmDbId}/mcpd. Mais je n'utilise pas les APIs pour extraire les données: je vais directement les chercher via les DAOs. Donc quel(s) DAO(s) dois-je utiliser? Est-ce bien GermplasmV2Dao (pour les champs dont l'origine est /germplasm/{germplasmDbId}) et GermplasmMcpdDao (pour les champs dont l'origine est /germplasm/{germplasmDbId}/mcpd)?
Question 5:
Que faut-il afficher dans la colonne "Organism". La spec dit sourceName, taxonId, à partir de la propriété taxonIds. Mais cette propriété est une liste. Je met tous les couples de la liste? Par exemple au format "source1 - taxon1, source2 - taxon2"?
Question 6:
Où trouver les informations des colonnes "Biological material latitude", "Biological material longitude", "Biological material altitude" et "Biological material coordinates uncertainty"?
La spec dit qu'il faut les trouver dans la propriété germplasmOrigin, mais cette prorpriété est une liste (donc N éléments et pas juste 1), de GermplasmOriginVO. Et dans un GermplasmOriginVO, il n'y a ni latitude, ni longitude, ni altitude. Seulement un coordinateUncertainty. Faut-il en fait utiliser la propriété originSite?
Question 7:
Que faut-il mettre dans la colonne Material source ID (Holding institute/stock centre, accession)? La spec dit d'utiliser la propriété donorAccessionNumber du donorInfo d'un germplasm MCPD. Mais il n'y a pas de donorInfo dans le VO GermplasmMcpdVO: la propriété est en commentaire. Et en outre, il s'agit d'une liste. Il y a en revanche une propriété donors dans le VO GermplasmV2VO. Mais il s'agit, là aussi d'une liste. Puis-je placer dans cette colonne les donorAccessionNumber des donors de GermplasmV2VO séparés par des virgules?
Question 8:
Similaire à la question 7. Que faut-il mettre dans la colonne Material source DOI? La spec dit d'utiliser la propriété donorAccessionNumber du donorInfo d'un germplasm MCPD. Mais il n'y a pas de donorInfo dans le VO GermplasmMcpdVO: la propriété est en commentaire. Et en outre, il s'agit d'une liste. Il y a en revanche une propriété donors dans le VO GermplasmV2VO. Mais il s'agit, là aussi d'une liste. Puis-je placer dans cette colonne les donorGermplasmPUI des donors de GermplasmV2VO séparés par des virgules?
Question 9:
Où trouver les informations des colonnes "Material source latitude", "Material source longitude", "Material source altitude" et "Material source coordinates uncertainty"?
La spec dit qu'il faut les trouver dans la propriété collectingInfo.collectingSite du Germplasm MCPD, mais cette prorpriété est en commentaire dans le VO GermplasmMcpdVO. Il y a en revanche une propriété collectingSite dans le GermplasmV2VO. Mais cette propriété référence en réalité le même champ du document ElasticSearch que originSite, donc si on utilise originSite pour les propriétés Biological material latitude, etc. (voir question 6), on se retrouvera avec deux fois les mêmes informations.