3万個が勝手に変動するのではなくて、有機的な相互作用があるというわけですね。
相互作用もあるし、ヒエラルヒーもあります。池に石を投げた時に出来る波紋の形を見て、石の大きさや飛んできた方向のパターンを推定できるのと同様に、遺伝子の動きから元の変化、癌であれば異常が何であるかという推測がかなり出来るようになっています。今までは3万個のうちの1個の変化を癌の目印にする研究がされていたのですが、やはりそれで全てを説明できるわけではないので、パターンで物事を見ようと。
先端研に来た当初は、バーチャルリアリティ(VR)が専門の廣瀬通孝教授や今は柏に移転された人工物研究センターの岩田修一教授のグループと3万個のデータマイニングを行う手法の開発をすすめました。データのパターンをウニのかたちに例えるなど、大量の情報を人に見やすくする方法を共同で開発するなど、先端研らしく非常に学際的な研究を進められたのは幸運でした。
現在は、生命が全体のシステムとしてどう制御されているかという研究と、それとは別に、個人の遺伝情報がどう違うかという研究をしています。地球上には何十億人という人がいますが、人種間はもちろん、同じ日本人でも相当違います。それを調べることで、メリットの方を言えば、どういう病気になりやすいか、どういう薬を飲むと副作用が出やすいか、ということがわかるようになります。
人間のDNAにはACGTの4つの塩基しか無いのですが、個体差で配列の違う箇所がゲノムの中に1000万くらいあります。1000万は107で人間のゲノムのサイズは3×109ですから、全体に対してごく一部の配列が個体間で違う。一部には繰り返しもある。親から子へ伝わるときに配列が変わってしまったり、一部がひっくり返ったりということが相当の頻度で起きています。起きる方向性はニュートラルで、おそらく生物が進化する過程で多様性を保とうとして生じているのではないかと考えられています。ゲノムの一部分のコピー数の個人差について、国際共同研究で「Nature」などで発表しました。
二重らせんやACGTなどは止まっている暗号として記録されて不変だと教えられてきた気がするんですけれども、実際には変わるということですか。
一人の人間の頭のてっぺんからつま先までは、基本的には変わりません。ただ世代から世代へは、ちょこちょこと変わっていく。さらに、一つの受精卵から神経や脳になる細胞もあれば、肝臓になる細胞もあって、それがどこでコントロールされているかが実は今一番、興味のあるところです。3×109個のACGTという4つのアルファベットの並びは決まりましたが、その意味はまだほとんど解読できていません。たんぱく質はこの領域が作るだろう、そのたんぱく質を作る遺伝子は25,000個くらいしかないだろう、ということはわかってきた。さらに細かく言えば、たんぱく質のユニットの使い分けもあります。それでもタンパク質の種類としては10万個程度。だとすると、10万個の部品で人間の体を本当に作れるのかとなると結構、難しいと思うんですね。お酒をつくる単細胞生物の酵母でも遺伝子は6000個、ハエでも1万数千個ありますから。
そこで、複雑な生物であるヒトの場合はもっと細やかなレギュレーションがあるというのが「転写レギュローム」というちょっと難しい言葉で表現されています。少しわかりにくいんですが、紐になったDNAあるいは染色体にメチル基やアセチル基、リン酸基といった修飾が入ることで例えば、神経になる細胞はここを使うとか、子どものうちはここを使うけれども大人になったらこっちを使う、あるいは子どもの頃使っていた遺伝子を、大人になって違う目的で使ったり、と細胞ごとに運命を変えているんですね。
その制御の仕組みが研究の目的なわけですね。
例えば、DNAにメチル基が入ってメチル化された領域はサイレンスされて不活性になってしまっているわけです。メチル化の乱れによって病気がひきおこされることもあります。ヒトのES細胞について聞かれたことがあると思いますが、どんな細胞にでもなれる細胞ですね。一つの細胞から人間の体は、口から腸までの消化管になる内胚葉、筋肉や骨、血液になる中胚葉、そして頭や皮膚になる外胚葉と大きく三つに分かれるわけです。ES細胞はその全てになる能力があるので、実験的に分化していく過程で先ほど言ったようなメチル化、あるいは染色体に加えられるマーキングによってこの領域は使う、使わないといったような制御の仕組みを調べています。
ES細胞は、まだフレキシブルで比較的染色体がルースな状態にある。それが分化すると固定され、染色体のある部分をコンパクトに折り畳んで使わなくしてしまう。使うところだけを開いておく。開いておくにもそのための目印が必要ですし、遺伝子を読み出すために転写因子が関係しています。ゲノムからRNAが作られる反応を「転写」、RNAからたんぱく質を作るところを「翻訳」といって、そ転写反応を直接指示するものが転写因子、これが人間の体には1500以上あります。
最近分かってきたことなんですが、DNAから生まれたRNAの中に、直接またDNAに働いてDNAの読み出しや翻訳反応、作られたRNAをそのまま壊してしまう機能を持ったRNAがある。RNAはおそらく生命の起源として最初に出てきたモレキュール(分子)で、構造的にも一本の鎖ですから形を変えやすく、酵素としての働きや蛋白質を認識する機能を持たせやすい。RNAが作られる時に転写因子がどこにつくかというレギュロームの研究は、国内では先端研がひとつのメッカになっています(参考文献1)。
3万個のパターンをみると、どの転写因子が使われているかの推測はある程度つくのですが、知りたいのは最後に現れた形質の違いを引き起こすためのもともとのDNA配列の違いです。これまでは、最終産物としてのRNAやたんぱく質の違いで病気を説明しようとしたんですが、転写因子が結合する塩基の配列が一つ違ったくらいでは完全に構造が変わるような0か1かの差にはならず、結果として転写の効率が3倍上がるといった程度です。しかしながら、アルツハイマー病などではその差が60年、70年積み重なって出現するわけです。
あるいはダウン症候群だと染色体の21番が2本か3本かという1.5倍の差にしか過ぎません。でもその差が、先ほどのDNAのコピーの問題もありますけれども人間の全体のシステムに大きな影響を及ぼします。コピー数の違いというゲノムの多様性があることを国際共同研究で明らかにして昨年発表しました(参考文献2)。
ということは、転写が正常に行われるようにコントロールできれば、そういう遺伝病を防ぐことができるわけですか。
そうですね。白血病の場合は転写因子が原因になっていることが多くて、本来であれば静かにしているべきものがONになってしまっている。子どもの頃だけに活動的であるべきものが大人になっても作られ続けたり、誤って作られたりすると癌みたいな状態になってしまうわけですね。染色体の構造が変わってしまうなどで、染色体がスイッチONの状態にしてしまうと、異常な転写が常に起きて細胞は、どんどん増殖を続けてしまいます。
DNAは細胞核にしまわれていますが、ここで何らかの刺激を受け取って核に伝わるとDNAから情報を読み出すので、その経路に異常があると問題が生じますので、その異常回路を遮断すればよいのです。最近、乳がんの治療で使われているハーセプチンという薬は、異常増幅を生じたHER2(ハーツー)という増殖因子受容体を抑える働きによって劇的に近い効果が出ています。
乳がんの話になりましたので女性ホルモンの話をすると、女性ホルモンの受容体はそれ自身が転写因子で女性ホルモンが結合すると、女性の機能を維持するための遺伝子を全てONにするわけです。乳腺の細胞は女性ホルモンが活発な時期に増殖しますから、50歳前後までが乳がんのリスクが高くて、女性ホルモンのレベルが下がるそれ以降は乳がんのリスクも低減します。もっとも年齢とともにリスクが小さくなるのは乳がんくらいですね。体内には新しい細胞を作る際に複製されるDNAの間違いを常に防ぐための監視機構があるんですが、60歳を過ぎる辺りでその機構がサボり始めて、急に変異が増加する。変異があちらこちらに入ってくると監視が追いつかなくなり、積もり積もって癌が発症しやすくなるわけです。