Home Wielocechowe analizy statystyczne - genetyka populacyjna globalne międzypopulacyjne analizy autosomalnego DNA Pheno.Q.4 - analiza wielocechowa populacji świata na bazie genów warunkujących rysy twarzy i pigmentację

Pheno.Q.4 - analiza wielocechowa populacji świata na bazie genów warunkujących rysy twarzy i pigmentację

Tym razem w analizie zostały użyte tylko około 750 SNP dla genów odpowiedzialnych za wygląd / fenotyp. Na ich podstawie na blogu www.euroegenes.blogspot.com [1,2], jego autor przygotował arkusz Pheno.Q.4 z danymi (link) wykorzystany w mojej analizie. Na bazie SNP autor stworzył komponenty (Southern / Northern / Sub-Saharan / East-Asian). Ja obliczyłem tylko średnie 182 populacji z podanych tam danych indywidualnych dla przeszło 3000 osób z różnych stron świata (link).

Część SNP w tej analizie odpowiedzialna jest za rysy twarzy (w tym również kształt nosa, czoła), reszta za pigmentację skóry (np. SLC45A5) / włosów / oczu (np. OCA2) i kształt włosów (np. EDAR), przynajmniej u części z populacji (bo u nie wszystkich odpowiadają za to te same geny).

 Wszystkie SNP można pobrać stąd (link). Tam też dokładne nazwy, można sobie samemu wygooglować co oznaczają, ja nie mam czasu ich wyjaśniać wszystkich teraz:)

Poniższa analiza jest o tyle ciekawa, że rozpatruje to co klasyczna typologia rasowa (twarz, nos, pigmentacja, kształt włosów itp.), ale nie z punktu widzenia fenotypu, a warunkujących go genów (oczywiście ich ekspresja jest modyfikowana przez szeroko pojęte środowisko i czasem zwykły przypadek). Stali czytelnicy tego portalu od razu zauważą, że grupowanie populacji jest zgodne z prawidłami dawnych podziałów rasowych... Jeszcze raz zwracam uwagę że klasteryzacja jest nie według całego aDNA, a tylko tych SNP, które są odpowiedzialne za wygląd. Stąd np. grupowanie Latynosów obok populacji europeidalno-mongoloidalnych z Azji Środkowej, gdyż reprezentują zbliżony fenotyp tzw. Metysów. Za to Dominikańczycy z Karaibów jako Mulaci zbliżają się do Etiopczyków czyli populacji europeidalno-negroidalnej. Artykuł przeznaczony dla tych którzy uważają że liczą się tylko genotypy badanych populacji, które zawsze dadzą inny wynik grupowania, niż gdy porównamy ich fenotypy:)

 

PCA dla 1 i 2 składowej

Kliknij obrazek by powiększyć

pca-phenoq4

 

PCA dla 1, 2 i 3 składowej (pokazuje dodatkowy wymiar informacji którego brak wyżej)

Można zobaczyć dokładniej rozmieszczenie populacji europejskich które są za bardzo skupione powyżej.

Wykres jest w 3D i można go przesuwać / obracać / przybliżać / oddalać (kliknij w obrazek by go powiększyć).

3d

 

Dendrogram (UPGMA - metoda nieważonych średnich połączeń)  wg metryki odległości Manhattan

Kliknij obrazek by powiększyć

manhattan

 

Non-Metric Multidimensional Scaling (skalowanie wielowymiarowe)

Dużo bardziej oddzieliło tu negroidów i mongoloidów.

Kliknij obrazek by powiększyć

mds

 

 Na podstawie:

  1. http://eurogenes.blogspot.com/2016/07/genome-wide-variants-of-eurasian-facial.html
  2. https://www.blogger.com/comment.g?blogID=4123559132014627431&postID=3503175670404638926&isPopup=true&bpli=1 (linki do plików sa podane właśnie w komentarzach autora: Davidsky, nie korzystałem z arkuszy linkowanych w pierwszym iu drugim komentarzu  bo zawierały tylko gotowe wartości PCA, dalej są właściwe)
  3. Dzięki też userowi Litvin z forum The Apricity za zwrócenie uwagi na ten temat:)

-------------------------

  1. Użyłem programu statystycznego do dendrogramów i wykresów - PAST (PAleontological STatistics) 3.12 (http://folk.uio.no/ohammer/past/)
  2. http://folk.uio.no/ohammer/past/past3manual.pdf - omówienie metod użytych w dendrogramach i wykresach generowanych przez program PAST

Menu portalu