En guide til metoder til forudsigelse af proteinstrukturer og software

For at udøve deres biologiske funktioner foldes proteiner ind i en eller flere specifikke konformationer, dikteret af komplekse og reversible ikke-kovalente interaktioner. Bestemmelse af strukturen af ​​et protein kan opnås ved tidskrævende og relativt dyre teknikker såsom krystallografi, nukleær magnetisk resonansspektroskopi og dobbelt polarisationsinterferometri. Bioinformatik-software er blevet udviklet til at beregne og forudsige proteinstrukturer baseret på deres aminosyresekvenser.

En sammenfattelse af proteinstrukturen

Som et alternativ til eksperimentel teknik hjælper strukturanalyse og forudsigelsesværktøjer med at forudsige proteinstruktur i henhold til deres aminosyresekvenser. Opløsning af strukturen af ​​et givet protein er meget vigtigt inden for medicin (for eksempel inden for lægemiddeldesign) og bioteknologi (for eksempel i design af nye enzymer). Feltet med beregningsmæssig proteinforudsigelse udvikler sig således konstant efter stigningen i maskinernes beregningskraft og udviklingen af ​​intelligente algoritmer.

Der er fire niveauer af proteinstruktur (figur 1). I proteinforudsigelse anvendes den primære struktur til at forudsige sekundære og tertiære strukturer.

Sekundære strukturer af proteiner er lokaliseret foldning inden i polypeptidkæden, der er stabiliseret af hydrogenbindinger. De mest almindelige sekundære proteinstrukturer er alfa-helikser og beta-ark.

Tertiær struktur er den endelige form af proteinet, når de forskellige sekundære strukturer alle er foldet ind i en 3D-struktur. Denne endelige form dannes og holdes sammen gennem ionisk interaktion, disulfidbroer og van de Waals kræfter.

Fire niveauer af proteinstruktur. Billede fra Khanacademy.org.

Proteinstruktur forudsigelsesmetoder og software

Der udvikles et stort antal strukturforudsigelsessoftware til dedikerede proteinfunktioner og specificitet, såsom forudsigelse af forstyrrelser, dynamikforudsigelse, strukturbeskyttelsesforudsigelse osv. Tilnærmelser inkluderer homologimodellering, proteintrådning, ab initio-metoder, sekundær strukturforudsigelse og transmembrane helix og signalpeptidforudsigelse.

Valg af den rigtige metode begynder altid ved at bruge den primære sekvens af det ukendte protein og søge i proteindatabasen efter homologer (figur 2).

Beslutningstagningskort for metode til forudsigelse af proteinstrukturer.

Her er nogle detaljerede metoder til forudsigelse af proteinstrukturer:

  • Forudsigelsesværktøjer til sekundær struktur

Disse værktøjer forudsiger lokale sekundære strukturer kun baseret på proteinets aminosyresekvens. Forudsagte strukturer sammenlignes derefter med DSSP-score, der beregnes på baggrund af proteinets krystallografiske struktur (mere om DSSP-score her).

Forudsigelsesmetoder til sekundær struktur er hovedsageligt afhængige af databaser over kendte proteinstrukturer og moderne maskinindlæringsmetoder såsom neurale net og understøttelsesvektormaskiner.

Her er nogle gode værktøjer til sekundær struktur forudsigelse.

  • Tertiær struktur

Tertiær (eller 3-D) struktur forudsigelsesværktøjer falder i to hovedmetoder: Ab initio og sammenlignende proteinmodellering.

Ab initio (eller de novo) proteinforudsigelsesmetoder forsøger at forudsige tertiære strukturer fra sekvenser baseret på generelle principper, der styrer proteinfoldningsenergi og / eller statistiske tendenser for konformationelle træk, som native strukturer erhverver, uden brug af eksplicitte skabeloner.

Al information om et proteins tertiære struktur er kodet i dets primære struktur (dvs. dets aminosyresekvens). Imidlertid kan der forudsiges et enormt antal af dem, hvoraf kun en har den minimale fri energi og stabilitet, der kræves for at blive foldet korrekt. Forudsigelse af ab initio-proteinstruktur kræver således en stor mængde beregningskraft og tid til at løse den oprindelige konformation af et protein og er stadig en af ​​de største udfordringer for moderne videnskab.

De mest populære servere inkluderer Robetta (ved hjælp af Rosetta-softwarepakken), SWISS-MODEL, PEPstr, QUARK. Gennemse en udtømmende liste her.

Hvis et protein med kendt tertiær struktur deler mindst 30% af dets sekvens med en potentiel homolog med ubestemt struktur, kan sammenlignende metoder, der lægger den formodede ukendte struktur med den kendte, anvendes til at forudsige den sandsynlige struktur af det ukendte. Homologimodellering og proteintrådning er to hovedstrategier, der bruger forudgående information om andet lignende protein til at foreslå en forudsigelse af et ukendt protein, baseret på dets sekvens.

Homologimodellering og proteintrådssoftware inkluderer RaptorX, FoldX, HHpred, I-TASSER og mere.

Referencer

De novo protein struktur forudsigelse. Wikipedia.

Proteinstruktur forudsigelse. Wikipedia