2009-09-22

Sustainable selection on body weight in minks

In several species breeders want to increase the body weight to obtain more efficient animals. Often animals are fed ad libitum to give the opportunity to animals to show their growth (as well as obesity) to a maximal extent. However, Danish scientist reported that this might not be sustainable - at least for minks. They conducted the experiment with restricted and ad libitum feeding regime and found out that minks from the restricted group were more fertile and had better utilization of feed. I wonder how does this relate to pigs, rabbits, etc.

2009-09-21

Gelmans talk at Applied Statistics conference in Ribno (Slovenia)

I had an oppurtunity to attend the talk by the Andrew Gelman at the Applied Statistics conference in Ribno (Slovenia). It was nice to meet him "in flesh" after reading his books and blog for quite some time now. He is more "funny" and relaxed than I anticipated, but his talk was very brilliant, He mainly talked about weakly informative prior - his new secret weapon ;) Some older slides about this topic are available here.

2009-09-20

ASD talk - Growth performance of station tested rams in Slovenia

I attended the 17th ASD congress in Abano (Italy). I had a presentation about our model development for genetic evaluation of performance tested rams on test stations in Slovenia.


Growth performance of station tested rams in Slovenia

SGD Talk - Fitting pedigree based mixed models in BUGS software

I have a talk today at the 5th SGD congress about fitting animal model (mixed/hierarchical/multilevel model with pedigree information) in BUGS. The abstract was posted before, while the talk slides are available bellow.
Fitting pedigree based mixed models in BUGS software

2009-09-10

Changing font size of R output in Lyx Sweave

Is there a simple way of reducing the size of the font of the R output in Lyx/Sweave? It should be simple, but I can't get anything to work. Placing\huge or \tiny in front of code chunk doesn't change the output.

My reply:
The trick is in what Sweave actually does. Sweave replaces the R code with the code and results, but as Sinput and Soutput environments, i.e.,
<<>>=
1 + 1
@
Becomes
\begin{Schunk}

\begin{Sinput}
> 1 + 1
\end{Sinput}

\begin{Soutput}
[1] 2
\end{Soutput}

\end{Schunk}
Therefore, I think you need to modify the Sinput and/or Soutput tex environments
defined in the Sweave.sty file. However, I have never done anything like that. I think there are some R packages on CRAN that did some of this things - I remember seeing green output etc.

2009-09-04

Povzetek Interbull srečanja v Barceloni

Od 22. do 23. avgusta sem se udeležil konference Interbull v Barceloni. Spodaj je povzetek pomembnejših prispevkov. Celotni prispevki pa so na voljo na spletni strani.


Tema: Nacionalni obračuni

V tem sklopu so bile predstavljene novosti, posebnosti, … iz nacionalnih obračunov plemenskih vrednosti.

• Genetic evaluation for fertility traits in Austria and Germany (Fuerst in Gredler)
Avstrijci so za populacijo lisastega in rjavega goveda predstavili nov pristop k analizi plodnosti krav, kjer so vključili pet lastnosti: NR56 ločeno za prvesnice in ostale krave, število dni od telitve do prve osemenitve in število dni od prve do zadnje osemenitve ločeno za prvesnice in ostale krave (FLI). S tem so zamenjali stari pristop z eno samo lastnostjo NR90. Plemenske vrednosti posameznih lastnosti (le NR56 in PZ ločeno za obe skupini) združijo najprej v indeks za plodnost (1/8*NRp + 3/8*NRk + 1/8*FLIp + 3/8*FLIk) in nato še v skupni selekcijski indeks, kjer je teža za »plodnost« ekonomsko ovrednotena in znaša 6,8% pri lisasti in 8,6% pri rjavi pasmi. Predstavili so tudi genetske trende za plodnost, ki ne kažejo negativnih premikov v zadnjih letih, kar je zaželeno.

• Predicting mastitis resistance breeding values from somatic cell count indicator traits (Eding in sod.)
Nizozemci so napravili pilotno študijo, kjer so iskali povezave med spremembami v številu somatskih celic (definirano na različne načine) in sub-kliničnim ter kliničnim mastitisom. Rezultate te študije sedaj uporabljajo pri nacionalnih obračunih, kjer imajo na voljo samo podatke o številu somatskih celic ne pa tudi o incidenci sub-kliničnih ter kliničnih mastitisov. Diskusija je tekla na temo, da ni mogoče in kako bi bilo možno zbrati podatke o kliničnih mastitisih.

• Simultaneous and recursive random regression models for milk yield and somatic cell score in Canadian Holsteins (Jamrozik in sod.)
Pri kravah z večjo količino mleka so mastitisi pogostejši. Standardni modeli za genetsko vrednostenje upoštevajo to povezavo, a pri tem ni jasno kaj je vzrok in kaj posledica. Skupina raziskovalcev iz Kanade je uporabila naprednejši model, kjer je možno testirati kaj je vzrok in kaj posledica. Rezultati njihove analize so pokazali, da povečana mlečnost rahlo povečuje število somatskih celic, medtem ko povečano število somatskih celic močno znižuje prirejo mleka. S tem so pokazali, da selekcija na večjo količino mleka ob spremljanju števila somatskih celic ne povečuje števila somatskih celic. Kljub temu, da naprednejši model omogoča testiranje vzročnih povezav, se rangiranje živali v primerjavi s standardnim modelom ni razlikovalo.

• Estimation of parameters for heterogeneous variance adjustment on test-day data (Márkus in sod.)
Teoretična in metodološka študija ocene heterogenih varianc (med leti, čredami, …) na simuliranih in realnih podatkih iz Skandinavskih držav.

• Estimation of variance components for Nordic red cattle test-day model: Bayesian Gibbs sampler vs. Monte Carlo EM REML (Lidauer in sod.)
Teoretična in metodološka študija različnih metod za ocenjevanje varianc v modelu, ki ga skupaj uporabljajo Skandinavske države.

• Impact of using reduced rank random regression test-day model on genetic evaluation (Leclerc in sod.)
Države z velikimi populacijami goveda se soočajo z velikimi seti podatkov in s tem posledično velikimi računskimi potrebami za genetsko vrednotenje. Francoska skupina je predstavila eno od možnosti za poenostavitev (redukcijo) statističnega modela, ki je računsko bistveno manj zahtevna a še vedno dovolj natančna.

• Genetic analysis of calf and heifer losses in Danish Holstein (Fuerst-Waltl in Sorensen)
Avstrijska in Danska raziskava je pokazala, da izgube telet in telic do starosti enega leta znašajo okoli 10% in da za to obstaja pričakovano majhen dednostni delež. Izgube po rojstvu so skupno večje kot pa izgube ob rojstvu. Ker je ekonomski pomen teh izgub znaten, se nakazuje možnost za izboljšanje tudi preko selekcije.

• Best use of conventional EBV of bull dams and combination with direct genomic values (Rensing in sod.)
Nemška skupina je predstavila enostavno študijo, s katero so pokazali, da je plemenska vrednost (PV) mladih bikov (telet), ki še nimajo rezultatov hčera, praviloma znatno precenjena. Sklepajo, da je to zaradi precenjenih PV bikovskih mater, saj imajo PV bikovskih očetov praviloma visoke točnosti. Precenjene PV bikovskih mater so najvrjetneje zaradi posebne nege rejcev. Predstavniki iz Nove Zelandije in Nizozemske so potrdili, da so pri njih opazili podobno situacijo. Precenitev PV mladih bikov je problematična, saj so le ti odbrani na podlagi te vrednosti. To posledično vodi do manjšega napredka. Za to Nemci za te živali upoštevajo PV le po očetovi strani. Problem precenjenih PV za mlade bike je pomemben tudi pri genomski selekciji, ker sta pričakovana plemenska vrednost (povprečje staršev) in SNP genotip edina vira informacij za PV mladih bikov.

• Multi-breed genetic evaluation for docility in Irish Suckler Beef Cattle (Evans in sod.)
Rezultati iz Irske kažejo, da je dednostni delež za agresivnost pri mesnih pasmah razmeroma velik. Podatke o agresivnosti zbirajo ocenjevalci kakor tudi rejci. Zbiranje podatkov je obvezno.

• Prediction of beef carcass cut yields using Video Image Analysis (Pabiou in sod.)
Na Irskem ocenjujejo kakovost večine klavnih trupov elektronsko od leta 2005. Pri tem je za vsak trup shranjena tudi slika v elektronskem formatu in shranjena v podatkovno bazo. V predstavljeni študiji so na manjšem setu trupov in naredili disekcijo in ocenili enačbe za napoved mase različnih prodajnih kosov mesa iz zbranih slik. Razvite enačbe bodo nato uporabili za oceno mase prodajnih kosov na liniji klanja in s tem pridobili fenotipske podatke za genetsko vrednotenje.

Tema: Mednarodni obračuni

• Joint Nordic Genetic Evaluation of Growth and Carcass traits in Dairy Breeds (Johansson in sod.)
Skandinavske države so testno izvedle genetsko vrednotenje pitovnih in klavnih lastnosti pri mlečnih pasmah goveda, saj pitanje telet prinaša nekaj dohodka. V analizo so vključili neto dnevni prirast kot dve lastnosti (prirast do starosti 550 dni in prirast nad starostjo 550 dni) in oceno klavnega trupa – omišičenost in zamaščenost. Ocenjeni dednostni deleži so bili v skladu z literaturo. Presenetljive so bile zelo visoke genetske korelacije med prirastom v dveh obdobjih.

• Beef without borders: genetic parameters for Charolaise and Limousine Interbeef genetic evaluation of weaning weights (Venot in sod.)
• Interbeef genetic evaluation of weaning weights for Charolaise and Limousine breeds (Venot in sod.)
• Genetic structure of the European Limousine metapopulation using pedigree analyses (Bouquet in sod.)
V okviru projekta Interbeef je bil razvit sistem genetskega vrednotenja za pasmi šarole in limuzin v Franciji, Danski, Irski, Švedski in Veliki Britaniji. Predstavljeni so bili rezultati, ki so pokazali, da so prednosti mednarodnega vrednotenja za mesne pasme manjši, ker so genetske povezave med državami manjše. Za omenjeni pasmi so genetske povezave med pari držav praviloma nične razen za pare s Francijo. Tako imajo od skupnega vrednotenja predvsem države z manjšimi populacijami (vse razen Francija). Prednost za Francoze je na drugi strani večja populacija in s tem povečana možnost za izogibanje parjenja v sorodstvu.

• Inbreeding rates in breeding programs with different strategies for using genomic selection (Sorensen in Sorensen)
Pri nekaterih mlečnih pasmah goveda je zaradi intenzivne selekcije znaten delež parjenj v sorodstvu. Genomska selekcija sicer prinaša nekaj prednosti, saj je pri tem zmanjšan pomen rodovnikov, a po drugi strani omogoča krajši generacijski interval in s tem dolgoročno večji genetski napredek in večjo stopnjo inbridinga. Danska raziskovalca sta izvedla simulacijo in skušala ugotoviti, kakšna sta genetski napredek in inbriding v primeru uporabe genomske selekcije. Na podlagi rezultatov sta predlagala, da bi se vsi odbrani biki enakomerno uporabljali ne glede na njihovo PV. S tem bi zmanjšali genetski napredek le za malo, hkrati pa bistveno zmanjšali stopnjo inbridinga. Njihov predlog se sicer zdi nenavaden, a gre za dejstvo, da nekoliko milejša selekcija ohranja genetsko variabilnost, ki je potrebna za dolgoročen napredek.

• Dairy cattle fit for diverging purposes (Montgomerie)
Predstavnik iz Nove Zelandije je pripravil provokativno predstavitev, v kateri je izpostavil dobre lastnosti krav pasme Jersey (J) – majhna telesna masa in relativno dobra mlečnost z izjemnim odstotkom maščobe in beljakovin. Na Novi Zelandiji je to druga najpomembnejša mlečna pasma, takoj za črno-belo (HF), in služi za vzrejo križank (JxHF). Kljub temu pasma Jersey v svetovnem merilu izgublja na pomenu. Ker je velik del mleka namenjen predelavi in ne direktni konzumaciji, je izpostavil, da bi morale rejske organizacije in mlekarne bolj sodelovati pri postavitvi cen in rejskih ciljev, saj ni smisel v pridelavi »vode« v mleku.

• Changes in selection of Italian Holsteins (Canavesi in sod.)
Predstavljene so bile novosti/spremembe pri genetske vrednotenju črno-bele pasme v Italiji. Bistvene spremembe so vpeljava več-lastnostnega modela za telesne ocene. Zaradi negativnih genetskih trendov za plodnost so povečali ekonomsko težo za to lastnost in se zaradi tega odpovedali delu genetskega napredka pri lastnosti mlečnosti.

Tema: Uporaba genomskih informacij pri genetskem vrednotenju

• Genomic conversion equations (Loberg in sod.)
Vpeljava genomske selekcije je povzročila nastanek nove skupine živali (mladi biki), za katere je potrebna mednarodna primerjava. V tej študiji so pri Interbull-u ocenili, kako so se spremenile korelacije med državami po uvedbi genomskih informacij. Sklenili so, da spremembe niso znatne in da vpeljava genomske selekcije ne spreminja korelacji med državami.

• Development of Genomic GMACE (Sullivan in VanRaden)
Predstavljena je bila metodologija za mednarodno primerjavo bikov, ki imajo poleg rodovnika in plemenskih vrednosti iz nacionalnih obračunov na voljo še t.i. genomsko plemenskih vrednost. Bik, ki je genotipiziran, s tem pridobi enako količino informacij kot bi jih prispevalo dvajset potomk.

• Relation between accuracies of genomic predictions and ancestral links to the training data (Lund in sod.)
Danski raziskovalci so pokazali, da so točnosti genomskih plemenskih vrednosti odvisne od »oddaljenosti« seta podatkov, ki je bil uporabljen za oceno učinka posameznih SNP označevalcev. Posledično so točnosti praviloma precenjene.

• Evidence of a bias in national evaluation due to genomic preselection (Percy in Ducrocq)
Standardne metode za genetsko vrednotenje v veliki meri odstranijo vpliv selekcioniranih podatkov, če so na voljo (fenotipski) podatki, ki so bili osnova za selekcijo. V primeru genomske selekcije so mladi biki odbrani na podlagi informacij staršev in lastnega genotipa. Tako v nacionalni obračun niso vključeni fenotipski podatki, ki bo omogočilo korekcijo za selekcionirane podatke. Posledično so ocene PV v nacionalnih obračunih podcenjene. Podcenjevanje se povečuje iz leta v leto. Posledično so tudi genetski trendi podcenjeni. Trenutno še ni jasno, katera rešitev je najbolj primerna.

• A simple way to combine genomic and classical information in national BLUP evaluations (Ducrocq in Liu)
• A simple method for correcting the bias caused by genomic pre-selection in conventional genetic evaluation (Liu in sod.)
Obe študiji sta predstavili način, kako bi lahko odstranili vpliv selekcioniranih podatkov. Noben pristop ni optimalen, a odstrani podcenitev v veliki meri.

• National genomic evaluations without genotypes (Harris in sod.)
Na Novi Zelandiji seme distribuirata dve podjetji. Obe podjetji sta investirali v genotipizacijo bikov in nista pripravljeni objaviti genotipov. Zato je računski center pripravil aplikacijo za izračun genomske matrike sorodstva. Obe podjetji pošljeta v računski center matrike namesto genotipov in tako obidejo problem »skrivanja« podatkov.

• Incorporation of correlation between SNPs into the genomic evaluation model (Szyda in sod.)
Nekateri SNP označevalci se nahajajo blizu na kromosomu. Zaradi tega lahko pričakujemo, da bi vključitev te informacije (korelacije) povečala točnost genomskih plemenskih vrednosti. Poljska skupina je preizkusila to idejo, a se je izkazalo, da je takšen model veliko slabši kot standardni pristop, kjer se korelacije med SNP označevalci ne označujejo.

• Estimating reliabilities of genomic breeding values (Calus in sod.)
Raziskovalci iz Nizozemske so predstavili študijo, kjer so pokazali, da so točnosti genomskih plemenskih vrednosti s sedanjimi metodami praviloma precenjene.

• Genomic evaluation testing environment (Jorjani)
Jorjani je razvil program za simulacijo genomskih podatkov, kar bo služilo za primerjavo in razvoj metod. Njegov program (izvorna koda in delujoč program) bo prosto dostopen pri http://genomicselection.net

• Genomic Selection in Simmental/Fleckvieh - First Results (Gredler in sod.)
Avstrijci so predstavili rezultate analiz genomskih podatkov pri bikih lisaste pasme. Uporabili so enake metode kot drugi raziskovalci pri črno-beli pasmi. Njihovi rezultati so nekoliko manj obetavni kot pri črno-beli pasmi. Razlog je lahko v manjši velikosti populacije in manjšem neravnotežju zaradi povezave, kar je lahko posledica manj intenzivne selekcije kot pri črno-beli pasmi. Omenili so, da sodelujejo z Nemci in da bodo v prihodnosti združili podatke in napravili skupno analizo.

• Canadian Implementation of Genomic Evaluations (Doormaal in sod.)
Kanadčani so predstavili, kako so vpeljali genomsko selekcijo. Z ZDA si v celoti delijo podatke, metode in programsko opremo. V Kanadi so rejci intenzivno začeli z genotipizacijo krav – rejci menijo, da če krava ni genotipizirana, ne spada več v skupino elitnih krav. Opravili so tudi oceno SNP označevalcev s setom podatkov samo za bike in nato še za bike in krave. Rezultati so pokazali, da vključitev krav ne izboljša oceno SNP označevalcev. Tako so v tem delu vključeni le biki. Se pa za genotipizirane krave v izračun plemenske vrednosti vključijo poleg rodovnika, lastne prireje in prireje potomk še genomska informacija (SNP označevalci).

• Implementation of genomic evaluation in German Holsteins (Reinhardt in sod.)
Nemci (VIT Verden) so genotipizirali znatno število bikov (nekaj tisoč) in razvili vso potrebno programsko opremo za vpeljavo genomske selekcije. Pri uporabi metod so sledili Američanom.

• Implementation and uptake of genomic evaluations in Ireland (Kearney in sod.)
Irci so zelo ekspeditno vpeljali genomsko selekcijo in so letos že distribuirali seme mladih bikov odbranih na podlagi genomske plemenske vrednosti (GPV). Ker pa imajo GPV nižjo točnost, so rejcem predlagali, da naj raje uporabljajo večje število bikov – vsaj tri ali štiri – napravili so skupine bikov, skupina za mlečnost, skupina za plodnost, … Rejci so upoštevali njihove nasvete v veliki meri.

• Work in progress on Italian Holstein genomic evaluation (van Kaam in sod.)
V Italiji trenutno poteka večje število genomskih projektov pri govedu in drugih gospodarsko pomembnih vrstah domačih živali. Ker je pri črno-beli pasmi vključeno veliko število osemenjevalnih centrov, bodo najbrž biki te pasme genotipizirani zadnji, saj imajo težave z dogovori in lastništvom podatkov. Drugače ima računski center iz Cremone razvite potrebno programsko opremo za implementacijo genomske selekcije.

• Experiences in validating genomic evaluations (Kistemaker in Sullivan)
Kanadska predstavnika ste izpostavila pomen nižje točnosti pri mladih bikih odbranih s pomočjo rodovnika (povprečje plemenskih vrednosti staršev) in genomskih informacij. Ti biki imajo nižje točnosti kot progeno-testirani biki. Ker pa so mlajši, omogočajo večji genetski napredek na leto. Predlog za rejce je tako, da se morajo zavedati tega in da je priporočljivo uporabljati večje število bikov kot do sedaj.

• Utility of unsymmetric mixed model equations for MACE with genomic information (Misztal in sod.)
Sedanji postopek obračunov za genomsko selekcijo je sestavljen iz več faz. Najprej se opravi nacionalni obračun, ki vključuje rodovnike in fenotipske podatke. Nato se del teh rezultatov uporabi v dodatnem obračunu samo za genotipizirane živali, praviloma samo bike. Trenutne metode za ta korak so računsko zelo zahtevne. Nato se oba obračuna združita v t.i. združeno plemensko vrednost. Pri vseh teh korakih je uporabljeno veliko število predpostavk in parametrov, ki jih praviloma ne poznamo. Misztal je predstavil metodologijo, ki omogoča enoten obračun za vse skupine živali – uporabijo se vsi trije viri informacij hkrati: (1) fenotipske vrednosti, (2) rodovniki in (3) SNP označevalci preko genomske matrike sorodstva. Trenutni rezultati kažejo, da je predstavljena metoda uporabna za zelo velike sete podatkov – milijone živali. Metoda še ni popolnoma razvita a obeta novo pot za uporabo genomskih informacij pri selekciji.

2009-09-03

Fitting lactation curves/functions in R

It is quite some time ago since I wrote a set of lactation curves/functions in R. I put those functions in the animSci package. However, the package is in a mess for quite some time now - I was adding some new functions, but did not have time to finish the job properly. This is also the reason that package was not published. I got several inquries about the lactation functions. Therefore, I compiled the package and checked that lactation curves work as they should. The package is now published here with a warning.

The key fact to fit a particular lactation curve in R is to create a function that will take a numeric variable (days in milk) and create a design matrix that can be fed to model fitting function such as lm() or similar, e.g.,

someFunc <- function(x, ...) ... lm(y ~ someFunc(x)) 

It must be noted that this approach is not the most efficient for large datasets, since design matrix can be large, but this is a well known problem with using lm() in R. I implemented four lactation functions: Wood, Wilmink, Ali-Schaeffer, and Guo-Swalve, but others can be added. Bellow is the R code to run the lactation curves example on a data set of four milk traits in goats and the resulting figure. It would be interesting to compare this functions with Legendre polynomials (see here) and splines.

## Add my repository
tmp <- c("http://gregor.gorjanc.googlepages.com",
contrib.url(repos=getOption("repos"),
type=getOption("pkgType")))

## Install the package
install.packages("animSci", contriburl=tmp, dep=TRUE)

## Load the package
library(package="animSci")

## Run the lactation curve examples
example(topic="lactCurves")


P.S. I got a nice cover up from David Smith.

Some lactation curves for milk traits in goat