KEGG API的用法是怎样的,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
get
根据提供的kegg 标识符,返回特定的记录,多个标识符之间用+
连接,一次最多允许10个标识符,格式如下
http://rest.kegg.jp/get/dbentries[/option]
dbentries = KEGG database entries of the following database
database = pathway | brite | module | ko | genome | org | vg | ag | compound |
glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | disease_ja | drug_ja | dgroup_ja | environ_ja | compound_ja
option = aaseq | ntseq | mol | kcf | image | conf | kgml | json
共有两种用法
第一种用法,不带任何的option, 返回的结果和网页版的结果类似
示例:返回hsa:10458
基因的信息
http://rest.kegg.jp/get/hsa:10458
ENTRY 10458 CDS T01001 NAME BAIAP2, BAP2, FLAF3, IRSP53 DEFINITION (RefSeq) BAI1 associated protein 2 ORTHOLOGY K05627 BAI1-associated protein 2 ORGANISM hsa Homo sapiens (human) PATHWAY hsa04520 Adherens junction hsa04810 Regulation of actin cytoskeleton BRITE KEGG Orthology (KO) [BR:hsa00001] Cellular Processes Cellular community - eukaryotes 04520 Adherens junction 10458 (BAIAP2) Cell motility 04810 Regulation of actin cytoskeleton 10458 (BAIAP2) Membrane trafficking [BR:hsa04131] Endocytosis Bin/Amphiphysin/Rvs (BAR) family proteins I-BAR proteins 10458 (BAIAP2) POSITION 17q25.3 ...
第二种用法,后面加上options 操作,需要注意的是,特定的数据库有特定的option。
对于gene 数据库而言,支持 aaseq 和 ntseq
, 返回基因的序列
示例:返回基因的核酸序列
http://rest.kegg.jp/get/hsa:10458/ntseq
>hsa:10458 K05627 BAI1-associated protein 2 | (RefSeq) BAIAP2, BAP2, FLAF3, IRSP53; BAI1 associated protein 2 (N) atgtctctgtctcgctcagaggagatgcaccggctcacggaaaatgtctataagaccatc atggagcagttcaaccctagcctccggaacttcatcgccatggggaagaattacgagaag gcactggcaggtgtgacgtatgcagccaaaggctactttgacgccctggtgaagatgggg gagctggccagcgagagccagggctccaaagaactcggagacgttctcttccagatggct gaagtccacaggcagatccagaatcagctggaagaaatgctgaagtcttttcacaacgag ctgcttacgcagctggagcagaaggtggagctgga
对于pathway 数据库而言,支持 image , conf, kgml ,但是一次只允许查询1条记录
示例: 返回hsa05130
的通路图
http://rest.kegg.jp/get/hsa05130/image
对于 compound, glycan, drus 数据库,支持 images , mcol, kcf 操作,对于images , 一次只允许返回一条记录
示例 : 返回 C00002
的结构示意图
http://rest.kegg.jp/get/C00002/image
conv
转换kegg 的ID 和其他数据库的ID
第一种格式,所有记录之间的转换
http://rest.kegg.jp/conv/target_db/source_db
(target_db source_db) = (kegg_db outside_db) | (outside_db kegg_db)
For gene identifiers:
kegg_d> = org
org = KEGG organism code or T number
outside_d> = ncbi-geneid | ncbi-proteinid | uniprot
For chemical substance identifiers:
kegg_db = compound | glycan | drug
outside_db = pubchem | chebi
示例: human的ncbi entrez ID 和 kegg 的ID 进行转换
http://rest.kegg.jp/conv/hsa/ncbi-geneid
ncbi-geneid:1 hsa:1 ncbi-geneid:10 hsa:10 ncbi-geneid:100 hsa:100 ncbi-geneid:1000 hsa:1000 ncbi-geneid:100008587 hsa:100008587 ncbi-geneid:100008588 hsa:100008588 ncbi-geneid:100008589 hsa:100008589 ncbi-geneid:100009667 hsa:100009667 ncbi-geneid:100009676 hsa:100009676
第二种格式, 某几条记录之间的转换,格式和第一种相同,只不过每次返回几条记录之间的对应关系,多条记录用+
连接,1次最多允许10条记录
示例,查询hsa:10458
和 ece:Z5100
两个基因对应的 ncbi protein id
http://rest.kegg.jp/conv/ncbi-proteinid/hsa:10458+ece:Z5100
hsa:10458 ncbi-proteinid:NP_059345 ece:Z5100 ncbi-proteinid:AAG58814
link
检索两个数据库之间的关联,共有两种用法
第一种,两个数据库之间的关联
http://rest.kegg.jp/link/target_db/source_db
target_db = database
source_db = database
database = pathway | brite | module | ko | genome | org | vg | ag | compound |
glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | atc | jtc | ndc | yj | pubmed
示例:human 基因和pathway 之间的对应关系
http://rest.kegg.jp/link/pathway/hsa
hsa:10327 path:hsa00010 hsa:124 path:hsa00010 hsa:125 path:hsa00010 hsa:126 path:hsa00010 hsa:127 path:hsa00010 hsa:128 path:hsa00010 hsa:130 path:hsa00010
第二种,查询某几条记录在两个数据库之间的关联
示例:查询hsa:10458和ece:Z5100 两个基因对应的pathway 信息
http://rest.kegg.jp/link/pathway/hsa:10458+ece:Z5100
hsa:10458 path:hsa04520 hsa:10458 path:hsa04810 ece:Z5100 path:ece05130
ddi
查找药物之间的相互作用关系 , URL 格式如下
http://rest.kegg.jp/ddi/dbentry
dbentry = Single entry of the following database
database = drug | ndc | yj
可以提供1个药物的ID, 也可以一次提供多个,多个ID 用+
连接
示例 : 查询和D005664
这种药物存在相互作用的记录
http://rest.kegg.jp/ddi/D00564
dr:D00564 cpd:C00304 P unclassified dr:D00564 cpd:C01946 P unclassified dr:D00564 cpd:C04931 P unclassified dr:D00564 cpd:C05849 P unclassified
kegg API 允许我们方便的获取各种资源,最大的好处是我们可以通过程序批量下载,比如批量下载一个物种所有的pathway通路图或者kgml 文件。
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。
原创文章,作者:506227337,如若转载,请注明出处:https://blog.ytso.com/tech/opensource/239677.html