Modèle cdd d`usage

La fonctionnalité des modèles est très en version bêta, et va évoluer de manière significative dans l`année à venir. Nous aimerions entendre ce que vous voulez être en mesure de faire avec les modèles, pour aider à guider cette évolution. Lisez le didacticiel sur les modèles CDD. Organisation phylogénétique: sur la base des données probantes issues de la comparaison des séquences, les conservateurs de domaine conservés de NCBI tentent d`organiser des modèles de domaine apparentés dans des hiérarchies de familles phylogénétiques (exemple illustré). Le programme CDTree utilisé par les conservateurs NCBI peut être téléchargé afin de voir les domaines organisés par NCBI de manière interactive et plus détaillée. Il est intéressant de souligner que la valeur de similitude maximale est indépendante du modèle bayésien, et fournit un moyen pour vous d`effectuer une recherche de similarité en utilisant tous les composés actifs à la fois. Nous introduisons CDD vision, un nouveau produit d`analyse et de visualisation, un modèle prédictif dans le cadre de CDD Vault, et une demi-douzaine de petites améliorations. Nous sommes ravis de voir ce que vous pouvez réaliser avec les outils de cette version. DÉTAILS supplémentaires: si plusieurs modèles de domaine classés par NCBI s`alignent sur un intervalle donné sur une séquence de protéine de requête et passent les deux critères ci-dessus, le modèle de notation la plus élevée est le hit spécifique et les autres modèles sont répertoriés comme des hits non spécifiques.

Le modèle de notation le plus élevé est en général celui avec la meilleure valeur E, mais si deux ou plusieurs modèles ont la même valeur E, alors leur score de bit est utilisé pour briser la cravate. Par exemple, les résultats de recherche de CD pour la séquence de protéines NP_229631 montrent plusieurs domaines organisés par NCBI alignés sur la même région de la requête. Les domaines les mieux classés par NCBI sont cd05297 (GH4_alpha_glucosidase_galactosidase) et cd05197 (GH4_glycoside_hydrolases), tous deux ayant une valeur E de 2e-169 (au 08 mars 2010). Cependant, le score de bit pour le hit à cd05297 (590,69) est plus élevé que le score de bit pour cd05197 (590,65), ainsi cd05297 est affiché dans les résultats de recherche de CD comme le hit spécifique et cd05197 est affiché comme un hit non spécifique. Dans le cas improbable où le score binaire est insuffisant pour briser la cravate, un seul Hit est choisi aléatoirement pour être un hit spécifique. (Note: le score de bit d`un CD-Search frappé à un modèle de domaine peut être vu en cliquant sur le plus (+) à gauche de son numéro d`accession dans le tableau “liste des hits de domaine” sur la page de résultats de recherche de CD. En outre, le score de bit de seuil spécifique au domaine pour un domaine organisé par NCBI est affiché dans la zone de statistiques de la page de résumé du CD du modèle de domaine.) En revanche, certaines séquences de requêtes protéiques peuvent avoir plusieurs occurrences dans des domaines sélectionnés par NCBI, et aucun d`entre eux ne s`affichera comme un hit spécifique. Cela est vrai dans les résultats CD_Search pour la séquence protéique NP_486772 (au 08 mars 2010). Dans ce cas, cd01662 (ubiquinol oxydase I) est le domaine le mieux classé (meilleur E-value) NCBI-sélectionné; Cependant, il n`est pas montré comme un hit spécifique parce que le score de bit de ce hit ne répond pas ou dépasse le seuil spécifique au domaine.