×

pdb蛋白质结构数据库

pdb蛋白质结构数据库(跨膜蛋白结构数据库包含哪些数据内容)

admin admin 发表于2023-03-21 06:53:04 浏览26 评论0

抢沙发发表评论

本文目录

跨膜蛋白结构数据库包含哪些数据内容


蛋白质结构数据库,一般用PDB,还有其他衍生出来的数据库,比如DSSP,HSSP等等。
如果要差序列结构,在NCBI中也可以差,EMBL中也都有,不过建议在PDB中查看,将文件下载下来,用一些常用的软件进行查看,并且可以看到一级,二级等高级结构,或者模拟结构。

蛋白质三维结构数据库的介绍


蛋白质结构数据库(Protein Data Bank,简称PDB)是美国纽约Brookhaven国家实验室于1971年创建的。为适应结构基因组和生物信息学研究的需要,1998年10月由美国国家科学基金委员会、能源部和卫生研究院资助,成立了结构生物学合作研究协会(Research Collaboratory for Structural Bioinformat-ics,简称RCSB)。PDB数据库改由RCSB管理,目前主要成员为拉特格斯大学(Rutgers University)、圣地亚哥超级计算中心(San Diego Supercomputer Cen-ter,简称SDSC)和国家标准化研究所(National Insti-tutes of Standards andTechnology,简称NIST)。和核酸序列数据库一样,可以通过网络直接向PDB数据库提交数据。


蛋白质三维结构数据库的数据格式


每个PDB文件可能分割成一系列行,由行终止符终止。在记录文件中每行由80列组成。每条PDB记录末尾标志应该是行终止符。PDB文件中每行都是自我识别的。每行的前六列存放记录名称,左对齐空格补足.必须和规定的记录名称一致。PDB文件也可看成是各种记录类型的总和。每个记录类型包括一行或多行又被更深一层分成各字段。以下是PDB文件存储数据格式的一个完整简洁的说明:
标题部分
1 HEADER(分子类,公布日期、ID号)
2 OBSLTE (注明此ID号已改为新号)
3 TITLE(说明实验方法类型)
4 CAVEAT(可能的错误提示)
5 COMPND(化合物分子组成)
6 SOURCE(化合物来源)
7 KEYWDS(关键词)
8 EXPDTA(测定结构所用的实验方法)
9 AUTHOR(结构测定者)
10 REVDAT(修订日期及相关内容)
11 SPRSDE(已撤销或更改的相关记录)
12 JRNL(发表坐标集的文献)
13 REMARK
REMARK 1(有关文献)
REMARK 2(最大分辨率)
REMARK 3(用到的程序和统计方法)
REMARK 4-999
一级结构
1 DBREF (其他序列库的有关记录)
2 SEQADV ( PDB与其他记录的出入)
3 SEQRES (残基序列)
4 MODRES (对标准残基的修饰)
杂因子
1 HET(非标准残基)
2 HETNAM(非标准残基的名称)
3 HETSNY (非标准残基的同义字)
4 FORMOL(非标准残基的化学式)
二级结构
1 HELIX(螺旋)
2 SHEET(折叠片)
3 TURN(转角)
连接注释
1 SSBOND(二硫键)
2 LINK(残基间化学键)
3 HYDBND(氢键)
4 SLTBRG(盐桥)
5 CISPEP(顺式残基)
晶胞特征及坐标变换
1 CRYST1(晶胞参数)
2 ORIGXn(直角-PDB坐标)
3 SCALEn(直角-部分结晶学坐标)
4 MTRIXn(非晶相对称)
5 TVECT(转换因子)
坐标部分
1 MODEL(多亚基时示亚基号)
2 ATOM(标准基团的原子坐标)
3 SIGATM(标准差)
4 ANISOU(温度因子)
5 SIGUIJ(各种温度因素导致的标准差)
6 TER(链末端)
7 HETATM(非标准基团原子坐标)
8 ENDMDL(亚基结束)
连通性部分
CONECT(原子间的连通性有关记录)
簿记
1 MASTER (版权拥有者)
2 END(文件结束)


蛋白质三维结构数据库的功能


PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)2.5维(以二维的形式表示三维的数据)结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。
PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。


如何使用PDB查询蛋白质结构


打开PDB数据库输入你知道的PDB编号 如果不知道编号就输入英文名称或者简称,搜索后出现蛋白质列表 一个个看 看哪个是你想要的。点一下,右上方有下载链接。下载xxx.pdb到本地磁盘后 用pymol或者rasmol软件打开看。或者用文本编辑器打开看详细的附加信息。

pdb的数据


蛋白质数据库(Protein Data Bank,PDB) 是一个生物大分子(如蛋白质和核酸)数据库, 内容包括由全世界生物学家和生物化学家上传的蛋白质或核酸的X光晶体衍射或者NMR核磁共振结构数据,这些数据可以通过PBD的会员组织(PDBe,PDBj,RCSB)免费获取。PDB是由世界蛋白质数据库(Worldwide Protein Data Bank,wwPDB)管理。PDB是结构生物学的关键性资源,大部分学术刊物,以及一些官方科研机构[如美国的国立卫生研究院(NIH)],现在都要求科学家将它们研究的蛋白质、核酸结构上传到PDB。
从PDB的网站上,可以通过蛋白质的编号查找到相应的3D结构,并可以将这个结构图下载到电脑中,通过PyMol、RasMol、Chimera、VMD、Swiss-PdbViewer等软件查看、编辑。
从PDB网站上下载的3D结构图的后缀名为.pdb。


蛋白序列、结构数据库常用的有哪些


蛋白质数据库介绍
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:

国际著名的三大蛋白质数据库


国际著名的三大蛋白质数据库有UniProt数据库、The Human Protein Atlas数据库、PhosphoSitePlus数据库。

1、UniProt数据库

蛋白组学常用数据库UniProt(全称UniProt Protein Resource),建立于1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的,其信息量丰富、资源广泛,是目前公认的首选免费蛋白质数据库。

2、The Human Protein Atlas数据库

The Human Protein Atlas内含近30000种人类蛋白质的组织和细胞分布信息,并提供免费查询。

瑞典Knut&Alice Wallenberg基金会利用免疫组化技术,检查每一种蛋白质在人类48种正常组织,20种肿瘤组织,47个细胞系和12种血液细胞内的分布和表达,其结果用至少576张免疫组化染色图表示,并经专业人员校对和标引,保证染色结果具有充分的代表性。

3、PhosphoSitePlus数据库

PhosphoSitePlus数据库是一个由CST和NIH联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些CST公司发现但未发表的蛋白修饰位点。

该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究PTMs在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。

性能及历史

蛋白质数据库(HPDB),建于2005年5月,动态展示生物大分子立体结构,鼠标点击放大分子结构、原子定位、测定原子之间距离,可用于教学或科研。服务对象是能够熟练使用中文的生命科学、医学、药学、农学、林学等领域的大中专学生、教师及科技工作者。

分子结构特征描述采用汉语,同时提供英文原文以供考证。对于善于使用英文的读者,我们提倡直接访问RCSB PDB,一来可以减少网络拥挤,二来可以减少由于HPDB的翻译不妥带来的不便。

蛋白质数据库(HPDB)对每个蛋白质分子结构说明部分做了中文翻译(最新加入数据库的分子除外),内容包括分子结构定性描述、样品的来源、表达载体、宿主、化学分析方法、分子结构组成成分等。这些信息并同蛋白质分子结构数据存储于数据库,因此HPDB支持中文查询。

蛋白质数据库(HPDB)虽然翻译了“分子结构说明”部分,但为了保证数据的可靠性和准确性,HPDB对一级结构序列及大分子结构坐标数据等未做任何改动,数据库保持RCSB PDB核实后的原始实验数据文件,并保持PDB文件格式和蛋白质分子编号。