2019年04月

ネットで検索すると子供の身長の予測式として
男子の身長=(父親の身長+母親の身長+13)÷2+2
女子の身長=(父親の身長+母親の身長-13)÷2+2
というのがコピペされて広まっているが、かなり古い式である。
調べると1990年に日本人の身長の予測値(期待値)として求められている*1

何が問題かというと最後の+2cmのところで、これは食生活など環境の変化によって世代ごとに平均身長が伸びる効果を表している。戦後、食生活が改善するにしたがってどんどん平均身長が伸びていたため、親の身長から子供の身長を予測するには+2cmを足す必要があった。ただ現代ではすでに身長の伸びがほぼ止まっているので、この2cmを足す必要はない。実際に2007年の論文では、+2cmを削除した式が提出されている*2
男子の身長=(父親の身長+母親の身長+13)÷2
女子の身長=(父親の身長+母親の身長-13)÷2
この式はより正しい式と言える。ただ遺伝学の標準的な式ではない。

遺伝学の標準的な式

こちらの記事で書いたが、子供の身長の期待値を求める遺伝学的に正しい式(遺伝学的回帰式)は
男子の身長= A ×遺伝率+男性の平均身長
女子の身長= A ×遺伝率+女性の平均身長

ただし A=(父親の身長-男性の平均身長+母親の身長-女性の平均身長)÷2
であり、遺伝率というものが出てくる(記事中では分布の中心を求める式に対応する)。
この式は身長だけでなく、体重、IQ、性格など、多数の遺伝子が関与する特性ならほぼ全てに当てはまる便利な式だ。前提として、親世代と子世代で平均身長を変化させるような環境変化がないことを仮定している。

この式を書き換えると遺伝率が100%のときに2007年の式
男子の身長=(父親の身長+母親の身長+13)÷2
女子の身長=(父親の身長+母親の身長-13)÷2
に等しくなる(男女の平均身長の差は13cm)。

2つの式の比較
身長の遺伝率は80%程度なので、2007年の式と遺伝学的回帰式は最大2cmくらいずれる。2つの予測式の比較は以下。

男子の身長の予測式

両親が平均身長のときには2つの式の予測身長が一致するが、両親の身長の和が平均から離れるほど、2つの式はずれる。両親の身長が高いときには2007年の式の方が予測値が大きく、両親が小さい場合には逆になる。ただこれらの式はあくまで子供の身長の期待値であって、それから上下に9cmほどばらつく(95%区間)ので大した違いではない*3


*1:緒方勤. "日本人の target height および target range について (第 1 編): target height および target range の設定." 日児誌 94 (1990): 1535-1540.

*2:Ogata, Tsutomu, Toshiaki Tanaka, and Masayo Kagami. "Target height and target range for Japanese children: revisited." Clinical Pediatric Endocrinology 16.4 (2007): 85-87.

*3:たまに「±9cmのバラツキは全て環境の違いが原因」という誤解を見るが、このバラツキには遺伝子と環境の両方の効果があって、遺伝子の効果の方が大きい。遺伝率80%だと、環境の違いによる身長のバラツキは±4.9cm、遺伝的なバラツキは±7.6cmほどになる。環境の違いは食生活や睡眠などで、遺伝的なバラツキは、親から受け継ぐ遺伝子が兄弟ごとに異なる効果(にほぼ等しい)。足して±9cmにならないと思うかもしれないが、確率分布の性質から二乗和をとる必要があって合計のバラツキは±√(4.9^2+7.6^2) ≒ ±9cmになる。


前回の記事の続き。身長や体重のように病気も量的遺伝するが、関係する遺伝子は一部しか特性されておらず、病気になったかどうかしか観測できないため、遺伝の計算には工夫がいる。
多数の遺伝子が関係し、遺伝の効果を統計的に扱わなければいけない病気や障害には以下のようなものがある。

多因子遺伝病
 糖尿病、心筋梗塞、癌、アルツハイマーなど

精神障害
 鬱、双極性障害、統合失調症、発達障害(自閉症、ADHD)など

これらはどれも遺伝と環境が組み合わさって発病する。特に上に並べた精神障害は、遺伝の影響が大きい。

現在のところ直接観測できるのは病気になったかどうかだけだが、量的遺伝学ではその背後に(身長や体重のような)連続的な形質の存在を仮定する。それは端的にいえばどれだけ病気になりやすいかを示す数値で、易罹病性(または易罹患性)と呼ばれる。

この分野では、易罹病性が身長や体重のように正規分布をし、ある閾値を超えると病気が発病するというモデルを用いる。下の図のように易罹病性が閾値tを超えると病気となり、閾値を越えなければ発病しない(そのため閾値形質と呼ばれる)。ここで問題になるのが易罹病性を直接観測できないことで、そのため身長や知能の遺伝よりも信頼性が落ちてしまうが、おおむねモデルとしては正しく、大きくは間違っていないと考えられている。将来的に関連する遺伝子とその効果量が全て把握されれば、易罹病性のうち遺伝できまる部分を測定できるようになるかもしれない。現在のところ原因となる遺伝子は一部しか同定されていない。

遺伝計算の例

統合失調症の易罹病性の分布
統合失調症を例にとって、父親のみが発症している場合に子供にどう遺伝するのか計算してみる。統合失調症は人口の約1%が発症するので、標準正規分布の性質から閾値tは約2.3になる。父親の易罹病性は、発症者の平均として2.6、母親の易罹病性は非発症者の平均として0として計算する。計算に必要な統合失調症の遺伝率は約80%と知られている。

親から子に直接遺伝するのは病気そのものではなく易罹病性(病気になりやすさ)だ。易罹病性の遺伝は、身長や知能の遺伝と同じように確率分布で表される。子供がもつ易罹病性の確率分布の中心は、父(2.6)と母(0)の中央値1.3に遺伝率0.8をかけた1.04となる。分布の幅(標準偏差)は一般集団の分布の幅と同じ1でいい*1

子供の易罹病性の確率分布
図のように分布の中心が右にずれることで、子供は統合失調症を発病しやすくなっている。子供が統合失調症を発症する確率は、閾値tより右の青く塗られた面積に等しく、9.9%と計算される。親が統合失調症だと子供が統合失調症にかかる確率は約10倍になるので、だいたいこのくらいだ。

統合失調症の遺伝率が80%と聞くと、とても遺伝しやすいと感じるが、直接遺伝するのは易罹病性なので、"遺伝する確率"はそこまで大きくはない。(遺伝率は、原因を遺伝要因と環境要因に分けたときに遺伝要因で説明できる割合。そもそも病気の遺伝率は閾値モデルを前提として求められている)

この閾値モデルを使えばカテゴリーに分かれる形質がどう遺伝するのか計算できる。他にも依存症(アルコール、タバコ、薬物)のなりやすさや、右利き左利きの遺伝の計算に使える。


*1:本当は少し小さくなるがややこしいので無視する

中学高校で学ぶ遺伝の法則といえばメンデルの法則だが、これを学んでも身の回りで起きる遺伝のことはほとんど説明できない。説明できるのは血液型の遺伝くらいではないだろうか。探せば他にもあるけど「耳垢が湿っているか乾いているかの遺伝」とか、どうでもいいことだ。
多くの人にとって重要な遺伝は、身長や体重、運動能力、知能や学力、性格、病気や精神障害(糖尿病、高血圧、鬱、発達障害…)などだろう。これらはどれも多数の遺伝子が関与しており、統計的に扱わなくてはいけない。一つ一つの遺伝子の効果は小さく、何百もの遺伝子が関与するので、よくある「〇〇の遺伝子を発見」というニュースはたいてい重要性が低い。これら多くの遺伝子が関与する遺伝を扱うのが量的遺伝学だが、別に難しくはなく簡単に計算できる。結果はメンデル遺伝と同じく確率で表される。

ここでは両親から生まれた子の表現型値(身長や体重などの値)の確率計算を「遺伝子ガチャの法則」として紹介する。
(「驚くべき」と煽りタイトルをつけているが、内容は初歩的な量的遺伝学の計算)

遺伝子ガチャの法則子供の表現型値は、正規分布にしたがってランダムで決まる。

正規分布の幅(標準偏差)は、集団の標準偏差×√(1-遺伝率^2÷2)

正規分布の中心は以下のように決まる。
子供の分布中心の集団平均からのずれ=親の表現型値の集団平均からのずれ(両親の中間値)×遺伝率

例1 身長の遺伝

具体的に図で見た方が分かりやすい。

日本人の身長の分布
身長を例にとって、父親が身長181cm、母親が身長164cmのときの子供の身長を計算すると下のようになる。

子供の身長の確率分布
上の計算式にあてはめて説明する。日本人の平均身長は男が171cm、女が158cmなので、平均からのずれは、父親が181-171=10cm、母親が164-158=6cmとなり、父(10cm)と母(6cm)の中間値は8cmとなる。身長の遺伝率は80%程度なので、子供の分布中心の集団平均からのずれは8×0.8=6.4cmとなる。分布の幅は、(日本人の身長の標準偏差)×√(1-遺伝率^2÷2)=5.4×√(1-0.8×0.8÷2)=4.5cm。

つまり子供の成人後の身長の確率分布は、男児の場合171+6.4=177.4cm、女児の場合158+6.4=164.4cmを中心とした正規分布で、その幅(標準偏差)は4.5cmになる。


身長は男女の平均値が異なるが、知能(IQや学力偏差値)のように男女の平均値が同じ特性では、男女の分布は等しくなる(※厳密にいえば分布の幅がやや異なるが、大まかに計算するには問題ない)。

例2 知能の遺伝

両親がIQ100の普通の男女としたときの子供のIQの確率分布は下の図のようになる(IQの遺伝率を80%として計算)。平均的な人からでも頭の良い子やおバカな子が生まれてくることが分かる。分布の標準偏差は12.4となり、一般集団のIQより少し幅が狭い(一般集団のIQの標準偏差は15)。両親のIQが高ければ子供のIQの確率分布は(分布の幅が同じまま)右にシフトし、両親のIQが低ければ左にシフトする。

子供のIQの確率分布

計算式の意味

上の公式で両親の中間値をとっているのは、子供が両親から同量の遺伝子を受け取ることに対応している。遺伝率をかけているのは、表現型値のうち遺伝で決まる部分を求めるため。子供の分布の中心がシフトするのは遺伝の効果で、分布に幅があるのは遺伝と環境の両方が影響している(遺伝率が高いほど遺伝の影響度が高くなる)。
なお知能が主に母親から遺伝するというのは都市伝説で、実際には両親からほぼ同じ割合で遺伝する。

身長や体重、運動能力、知能や学力、性格については数値化できるので、どれも上の同じように計算できる(性格については性格テストの結果を利用する)が、病気/病気ではない、のように2つのカテゴリーに分かれる形質では計算に工夫をこらす必要がある。それは次の記事で紹介する。

↑このページのトップヘ