De Protein Data Bank (PDB) is een verzameling van informatie over de driedimensionale (3-D) structuur van grote biologische moleculen, zoals eiwitten en nucleïnezuren. Biologen en biochemici uit de hele wereld sturen de gegevens op. De meeste gegevens zijn afkomstig van röntgenkristallografie of NMR-spectroscopie. Iedereen kan de PDB gratis online raadplegen. De Worldwide Protein Data Bank, wwPDB, beheert het PDB.
De PDB is nuttig voor wetenschappers die structurele biologie en structurele genomica bestuderen. Veel wetenschappers moeten hun gegevens naar de databank sturen. Grote wetenschappelijke tijdschriften en sommige financieringsinstanties, zoals de National Institutes of Health in de Verenigde Staten, hebben regels die wetenschappers opdragen hun gegevens naar de PDB te sturen. Het PDB heeft de oorspronkelijke of primaire gegevens. Honderden andere databanken hergebruiken de gegevens. Deze secundaire databanken ordenen de informatie op verschillende manieren. Zowel SCOP als CATH bijvoorbeeld, delen de structuren in in groepen die zijn georganiseerd volgens het type structuur en ideeën over hoe zij door de evolutie met elkaar in verband staan. De ontologie van genen groepeert de gegevens op basis van genen.