2008-03-14

Koeficienti "sorodstva"

Sam sem se že velikokrat zmotil glede t.i. koeficientov sorodstva. Pred časom sem si vzel nekaj časa in si pri sebi razčistil za kaj gre. Ker vidim, da nekateri drugi prav tako mešajo zadeve kot sem jih jaz, sem se odločil napisati tale post.

V angleški literaturi (vsaj tisto kar jaz berem) se za opis sorodstva najpogosteje pojavljajo sledeči izrazi (brez kakšnega posebnega vrstnega reda):
  • coeffcient of relationship
  • coeffcient of relatedness
  • coeffcient of kinship
  • coeffcient of parentage
  • coeffcient of coancestry
  • coeffcient of consanguinity
  • coeffcient of identity
  • coeffcient of inbreeding
Strela. Toliko izrazov za eno in isto figo. Pa je res ena in ista figa? Če pogledam v moj slovar (ASP32, v1.40), dobim tole:
  • relationship - sorodstvo, sorodnost, zveza, odnos, razmerje, soseščina, degree of ~ sorodstvena stopnja
  • relatedness - sorodnost, sorodstveno razmerje
  • kinship - (krvno) sorodstvo, sorodnost
  • parentage - poreklo, rod, vir
  • coancestry - ... brez zadetka ...
  • consanguinity - krvno sorodstvo, sorodnost
  • identity - identiteta, istovetnost, enakost
  • inbreeding - parjenje med sorodnimi vrstami
Glede na slovar bi lahko rekli, da gre za eno in isto zadevo - razen za identity. OK, izločim lahko "identity", ostalo pa gre za isto zadevo. Super! Ampak ko bereš en članek in drugi članek pa še kakšno knjigo, po možnosti dve, tri, vidiš, da avtorji govorijo o podobnih, a vendarle različnih konceptih. O čem govorijo?

Za "coefficient of relationship" lahko mirno uporabimo prevod koeficient sorodstva. Ta prevod je najbolj logičen. Ob tem koeficientu večina avtorjev navaja delo Wright-a iz leta 1922, v katerem je koeficient sorodstva izpeljal kot korelacijo med plemenskimi vrednostmi. Plemenska vrednost ali tudi aditivna genetska vrednost je seštevek povprečnih učinkov alelov. Vsak ve, da diploidni organizmi prejmejo pol genoma (tistega v jedru) od očeta in pol od matere. ker je delitev naključna, imata npr. brat in sestra polovico alelov (pojavnih oblik gena) enakih. Če smo natančni, naj bi imela brat in sestra v povprečju pol alelov enakih. Ker je plemenska vrednost seštevek povprečnih učinkov alelov, je logično, da bo korelacija med plemensko vrednostjo brata in plemensko vrednostjo sestre enaka 0,5, saj imata polovico alelov skupnih in je tako polovica njunih plemenskih vrednosti "enaka". No povsem enak rezultat je dobil tudi Fisher leta 1918 (glej tabelo na sedmi strani članka; Fisher, 1918). Prikažimo še na primeru. Predpostavimo, da imamo dva osebka, ki sta nesorodna in nista inbridirana - nista rezultat parjenja v sorodstvu. Potem morata imeti na enem lokusu vsak po dva alela, ki sta različna po izvoru. Oče je po genotipu AB, mati pa CD, kjer so A, B, C in D aleli različni po poreklu - imajo različni izvor. Če imata ta dva osebka potomce, so ti lahko po genotipu AC, AD, BC in BD (naredil sem vse možne kombinacije alelov od staršev). V preglednici sem namenoma naredil dva potomca, zaradi prikaza izračuna koeficientov. Predpostavimo, da sta brat in sestra. Oba imata možnosti za vse od štirih naštetih genotipov:












Oče: AB
Mati: CD

Sin: AC
Hči: AC
Sin: AD
Hči: AD
Sin: BC
Hči: BC
Sin: BD
Hči: BD

Koliko alelov, ki so identično po poreklu imata brat in sestra? Naj bi jih imela eno polovico. Preverimo. Naredil bom tabelo, kjer bom na vrh nanizal možne genotipe enega potomca in na levo stran nanizal možne genotipe drugega potomca. Če se ujemata oba alela (kot v celici zgoraj levo), vstavim vrednost 1,0. Če se ujema le po en alel, vstavim vrednost 0,5. Če se ne ujema noben alel, vstavim 0.0.










ACADBCBD

AC
1,00,50,50,0
AD0,51,00,00,5
BC0,50,01,00,5
BD0,00,50,51,0



Sedaj vse vrednosti seštejem in dobim vrednost 8. Vseh možnosti je 16. Torej so bili aleli po poreklu identični v 8 primerih od 16 oziroma v 8/16 = 1/2 (polovici) primerov. Torej lahko rečemo, da je koeficient sorodstva enak verjetnosti, da imata dva osebka na določenem lokusu po poreklu identične alele. Pozor! Tukaj so v obravnavi VSI aleli.

Kaj je pa sedaj z ostalimi koeficienti? Sam bi si upal reči, da je "coefficient of relatedness" res ista figa kot "coefficient of relationship".

V istem članku je Wright (1922) definiral "coefficient of inbreeding" kot korelacijo med gametami, ki se združita in posledično ustvarita nov osebek. Pri diploidnih organizmih nosijo gamete enojno število kromosomov in s tem samo po en alel z določenega lokusa. Torej lahko rečemo, da je Wright definiral koeficient inbridinga kot korelacijo med dvema aleloma, ki sta naključno izbrana - prvi alel od prvega osebka in drugi alel od drugega osebka. Če sta osebka sorodna, obstaja možnost, da bo izbrani par alele po poreklu identičen. Torej je koeficient inbridinga enak verjetnosti, da sta dva naključno izbrana alela od dveh osebkov identična po poreklu. Pozor! Tukaj gre samo za dva alela; po en od vsakega osebka.

Poglejmo na našem primeru. Sin in hči lahko producirata gamete, ki nosijo enega izmed alelov: A, B, C ali D. Naredim vse možne kombinacije med aleli in dobim tole:











ABCD

A
AAABACAD
BABBBBCBD
CACBCCCCD
DADBDCDDD



Vseh kombinacij je 16 in v 4 primerih sta alela identična po poreklu. Torej je koeficient inbridinga enak 4/16 = 1/4.

Kaj pa "coefficient of kinship", "coefficient of parentage", "coefficient of coancestry" in "coefficient of consanguinity"? Moj slovar pravi, da naj bi šlo za enak prevod kot pri zgornjem koeficientu sorodstva. Ampak, ko berem literaturo, opažam, da se ta poimenovanja vežejo na delo Malecot-a (1948). Ta je definiral "Les coefficients de parenté". Sam ne znam francosko in njegove knjige še videl nisem (razen nekaj odsekov pri Google Books). Vrednost tega koeficienta naj bi bila za brata in sestro 1/4. Hmm. Res ne gre za isto zadevo. Ali pač? Ne, ni šans, saj vsak ve, da imata brat in sestra polovico skupnih genov (alelov). Torej so tile koeficienti nekaj drugega. Kaj? Epperson (1999) je opisoval delo Malecot-a, in med drugim pove, da je Malecot "Les coefficients de parenté" kasneje imenoval kot "identity by descent". Tole lahko mirno prevedemo kot identično po poreklu. Nagylaki (1989) je tudi opisval delo Malecot-a in jasno nakazal, da je Malecot-ov koeficient verjetnost, da sta dva naključno izbrana alela identična po poreklu. Če izberemo alela od enega osebka, dobimo koeficient inbrindinga tega osebka, če pa izberemo alela od dveh osebkov, dobimo koeficient inbridinga njunega potomca. Torej so "Malecot's coefficient", "coefficient of kinship", "coefficient of parentage", "coefficient of coancestry" in "coefficient of consanguinity" pravzaprav le druga poimenovanja za koeficient inbridinga in ne za koeficient sorodstva. Kot smo videli na primeru, je koeficient inbridinga odvisen od sorodstva med starši. Če starši niso sorodni, potem potomec ni inbridiran. Če sta starša sorodna in nista inbridirana, bo koeficient inbridinga pri potomcu enak polovici koeficienta sorodstva med staršema.

Epperson, B. K. 1999. Gustave Malécot, 1911–1998: Population Genetics Founding Father. Genetics, 152: 477-484.
http://www.genetics.org/cgi/content/full/152/2/477

Fisher, R. A. 1918. The correlation between relatives on the supposition of Mendelian inheritance. Royal Society of Edinburgh from Transactions of the Society, 52: 399-433.
http://digital.library.adelaide.edu.au/coll/special/fisher/9.pdf

Malécot, G. 1948. Les mathématiques de l'hérédité. Masson et Cie., Paris.
http://books.google.com/books?id=S5oKAAAAMAAJ&q=%22Les+math%C3%A9matiques+de+l'h%C3%A9r%C3%A9dit%C3%A9%22&dq=%22Les+math%C3%A9matiques+de+l'h%C3%A9r%C3%A9dit%C3%A9%22&hl=sl&pgis=1

Nagylaki, T. 1989. Gustave Malecot and the transition from classical to modern population genetics. Genetics, 122:253-268
http://www.genetics.org/cgi/reprint/122/2/253

Wright, S. 1922. Coefficients of inbreeding and relationship. Americna Naturalist, 56: 330-339.
http://dx.doi.org/10.1086/279872

No comments: