2E-09Back
教師無し説明可能型AIを用いた比較ゲノム解析:ヒトとコウモリゲノムを中心に
*池村淑道[1], 岩﨑裕貴[1], 和田健之介[1], 和田 佳子[1], 阿部貴志[2]
[1]長浜バイオ大学・バイオサイエンス学部, [2]新潟大学・工学部
連続塩基組成は生物種別に明瞭な特徴がありgenome signatureと呼ばれる.ヒトとコウモリゲノム由来の1Mb断片配列について2~6連塩基組成に着目し,一括学習型自己組織化マップを用いた解析を行った. 2~3連のような短い連続塩基においても,ヒトとコウモリの分離は明瞭であり,コウモリ染色体上のテロメア近傍にCGが顕著に集中する構造を見出した(Mb-level CpG islands).6連の場合には生物種別の分離は更に明瞭になる.このような長さの連続塩基は転写因子の結合配列(TFBS)となる例も多い.ヒトのセントロメア近傍のヘテロクロマチン領域に多様なTFBSの集中領域を観察した.
keywords: 機械学習;オリゴヌクレオチド組成;比較ゲノム
Unsupervised AI-supported comparative genomics of human and bat by focusing on oligonucleotide usage
*Toshimichi Ikemura [1], Yuki Iwasaki [1], Kennosuke Wada [1], Yoshiko Wada [1], Takashi Abe [2]
[1] Nagahama Institute of Bio-Science and Technology. [2] Faculty of Engineering, Niigata Univ.