EcoPDB:高精度大肠杆菌蛋白质结构与对应基因序列数据集
来源:     发布日期:2020/06/09 21:16:04  浏览次数:

EcoPDB:高精度大肠杆菌蛋白质结构与对应基因序列数据集

EcoPDB: A High Quality Dataset of Escherichia coli Gene Sequences and Corresponding Protein Structures

DOI:

中文关键词: 基因序列 蛋白质结构 数据集 大肠杆菌

英文关键词: coding sequence,protein structure,dataset,E. coli

基金项目:国家自然科学基金项目资助课题(项目号39760027).

李炜疆 宋江宁

李炜疆(无锡轻工大学工业生物技术教育部重点实验室,江苏无锡 214036)

宋江宁(无锡轻工大学工业生物技术教育部重点实验室,江苏无锡 214036)

摘要点击次数: 259

全文下载次数: 334

中文摘要:

高质量蛋白质结构及其对应基因序列数据是研究蛋白质折叠与蛋白质编码序列关系问题的基础.通过查询SWISS-PROT数据库中E.coli的蛋白质,得到不同数据库中的蛋白质结构与基因序列的交叉索引表,在此基础上,删除大量冗余及不可靠数据,最后得到一个高精度数据集EcoPDB.该数据集共有191个E.coli基因及其相应的精度好于2.5?的X射线衍射测定的PDB蛋白质结构数据,总残基数约5.5万.

英文摘要:

High quality data about protein structures and their gene sequences are essential to the understanding the relation between protein folding and protein coding sequences. By query about Escherichia coli proteins in SWISS PROT,a cross reference table

查看全文 查看/发表评论 下载PDF阅读器