研究成果と達成度

A01班
A02班
A03班
A04班
B01班
B02班
B03班
ゲノム班
B03班 「モデル脳による記憶・学習・思考の研究」
研究の概説

 本プロジェクトは神経回路モデルによる記憶・学習・思考の研究について、神経回路網のダイナミクスとその情報表現に注目し、理論と実験の有機的研究を実施した。

1 モデル脳におけるコーディングとエルゴード性に関する数理的研究(合原一幸)
 脳内の情報コーディングに関して、ニューロン集団の発火率が外界入力の情報をコードする仮説と同期発火が情報をコードする仮説がある。これらは長い間排他的な仮説と見なされてきたが、われわれが以前提案したデュアルコーディングは、これら双方が同一ネットワークの中で相補的に行われる可能性を示唆するものである。本研究では、この脳における情報コーディングの問題を、生理学的エルゴード性問題にも注意を払いつつ、脳やニューロンの数理モデルを用いて解析した。
 一般に、ニューラルネットワークは実際には絶え間ないシナプス学習を伴なっている。学習則によって作られるニューロン間の結合構造の数理解析は、主として離散時間とバイナリ状態関数のもとで扱われることが多い。しかしながら、生物のニューラルネットワークは連続時間で動作、し,発火ダイナミクスを持つ。連続時間スパイキングニューロンの結合系の解析では、集団ダイナミクスさえまだ完全には明らかになっておらず、ダイナミクスとネットワークの情報処理機能との関連については未解決問題が多く残されている。この問題に際して,最近,スパイクを送るニューロンとスパイクを受け取るニューロンの詳細な発火時刻の関係性に依存するスパイクタイミング依存性長期増強( STDP 学習)が生理実験で観測されている。この実験結果は、発火率や離散時間・バイナリ状態では記述できないような発火ダイナミクスを持つニューロンモデルの重要性を示唆している。また、STDP 学習によって構築されるシナプス結合の幾何的構造は、クラスタリングやダイナミカルアセンブリーなどの重要な機能発現に関わっていると予想される。そこで、 STDP 学習則のネットワークダイナミクスへの影響を、学習微分方程式系の不動点・安定性解析、コンピュータシミュレーションによる解析によって数理的な解析を行った。本研究によってニューロンが多数あるときは、それらの同期または非同期によって、一部のニューロンからなるクラスターがある入力を、他のクラスターが他の入力、をという様に、クラスターごとに異なる入力をコードできることが示された。複数のクラスターは、単一のニューラル・ネットワークの中に共存することができて、STDP学習は、空間的多重コーディングを発現するメカニズムを内包していると言える。
このSTDP学習を通じた解析により、空間的に非一様性であるネットワークの重要性が示唆された。実際にはニューラル・ネットワークのトポロジーも空間的に一様ではないことが示唆されている。そこで、スモールワールド・ネットワークを用いた数値解析により、同期や情報バインディングの発現機構を調べた。その結果、スモールワールド・ネットワークは離れたニューロン集団の同期の効率を上げつつ、クラスター内の同期を下げないメカニズムを持っていることが明らかにされた。
 実際のニューラル・ネットワークの構造について、もう一つの大切な点は階層性である。デュアルコーディングの研究は2層ネットワークにおいて最初に行われたが、 3層ネットワークでフィードバックを伴う場合にモデルを拡張した。フィードバックは、例えば多くの異なる視覚領野の間に相互結合があることからもわかるように、脳内に多くあると考えられている。このような場合にもデュアルコーディングが成立し、フィードバックは同期を高める役割を持つことが示された。
 次に、同期コーディングの拡張として、「繰り返し発火パターン」に関して、よく知られた回路構造であるメキシカンハット型回路の効果を調べた。この「繰り返し発火パターン」を説明する単純なモデルはSynfire Chainと呼ばれ、フィードフォワード型の一様結合をもつ神経回路を同期した発火が安定に伝播していくモデルである。
 上記のモデルをもちいて、より詳細に発火パターンの時空間ダイナミクスを調べるため、空間情報コーディングを行うモデルに限定し、McCulloch-Pittsニューロンモデルを用い理論的にモデルの性質を調べた。この結果は再現性のある「繰り返し発火パターン」を生成するようなネットワークにおいて、より生物学的に妥当な空間結合によってより多様な情報がコードできる事を示している。
 最後に、最近新たに得られた脱分極性GABAA入力の知見を基に、その情報コーディングとの関係を解析した。このモデル結果は最近の生理実験データをよく説明している。

図1 STDP学習を伴う層状ニューラル・ネットワーク




2 海馬の短期記憶モデルと実験(塚田稔、津田一郎)
 海馬の長軸方向の断面を図2に示す。この断面内には、一巡する神経回路網が三つのシナプスを介して形成されている。そして、海馬への入力としての空間信号は、歯状回(DG)の顆粒細胞へ入力され、その出力はCA3錐体細胞の樹状突起にシナプスをつくる。CA3の出力である側枝はCA1の錐体細胞の樹状突起にシナプスをつくる。CA1の錐体細胞の軸索は海馬台に至り海馬の主な出力となっている。また、直接CA1に接続するルートも存在する。この回路はちょうど金太郎飴と同じように断面はすべて同じ構造をもつ。 海馬のCA3にはフィードバックをもった回帰性の結合を持つ特徴的な神経回路網が存在する。この回路網は、過去の履歴現象を現在に重ね合わせ、時間系列情報の処理をする。利根川(マサチューセッツ工科大学)らのグループは、遺伝子技術を使って、このフィードバック神経回路網を破壊した欠陥モルモットは、ひとつの行動目的を達成するのに非常に多くの手掛りが必要になることを報告している。このことによって、海馬のCA3神経回路網は、時空間の文脈を形成するのに重要な役割をしていることがわかる。林ら(Hayashi and Ishizuka, 1995)は海馬CA3野における引き込みとカオス的応答の存在を見つけ、津田(Tsuda,1992)は海馬CA3の時空間文脈の形成にはカオスアトラクタ(カオス的遍歴)が有効であることをモデルによって示した。また、海馬CA1ではその文脈がニューロンの膜電位の履歴に階層的に埋め込まれること(カントールコード)を理論的に示した。合原らは津田理論のハードモデルを実現した。また、塚田らは時空間パターンをCA1回路のシナプス荷重空間に一時的に貯えるのに時空間学習則が有効に働いていることを理論と実験によって示した。これらの知見は、短期記憶における時空間文脈情報のコーディングのメカニズムを説明するものである。

図2 海馬の短期記憶と時空間学習則

(1) 海馬CA1で働く学習則
海馬CA1の実験結果から導出した学習則発議の2つの要素からなる。ひとつは、入力細胞間のタイミング依存性長期増強(STDPとは異なる)である。これはヘブの学習則と異なり、多数の入力細胞がどれだけタイミングを一致させて情報を送っているかが重要である。もうひとつは、時間的な履歴現象があり、順序関係や時間系列の情報をシナプス荷重に写像する機能である。この時空間学習則によって、海馬CA1では時空間の文脈をシナプス荷重空間に写像している。実験データに理論式をパラメータフィッテングさせると、タイミングの一致性の時定数として約17ミリ秒、また、時間履歴の時定数として169ミリ秒となった。前者は海馬に存在するγ波に非常に近い時定数であり、後者はθリズムといわれる振動に非常に近い時定数になっている。

(2) 学習則の機能比較
 ヘブの学習則と比較して、時空間学習則がどのような能力をもっているか、モデルによってその機能を比較してみた。入力が相互にランダムに結合している120からなる一層のネットワークを構築した(図1参照)。シナプス荷重の初期値は、小さい値の範囲でランダムにし、ヘブの学習則と時空間学習則を用いて入力の時空間パターンを学習させ、そのパターン分離機能を調べてみた。
 同一の発火頻度をもつ5個の空間パターンを1つの系列パターン(時空間パターン)とし、その先頭から4個の空間パターンの順序をいれかえると、24個の時空間パターンができる。この24個の時空間パターンを学習させ、学習後のそれぞれの入力に対し24個の出力パターンが得られる。この出力パターン間の類似度(ハミング距離)を調べることによってパターン分離機能を調べた。その結果、ヘブの学習則とヘブの拡張則であるコバリアンス学習則は24個の入力時空間パターンに対してほとんど類似な出力になる。すなわち、平均発火率が同一ならば同一の出力パターンに引き寄せる性質がある。それに対して、時空間学習則はハミング距離空間上に広く分散する。したがって、パターン分離という観点からは、時空間学習則は時間順序や時間パターンの分離能力が高く、ヘブの学習則は平均発火頻度を処理していることがわかった。

3 海馬-皮質系のモデルと実験(塚田稔)
(1) 海馬-聴覚皮質の信号処理
 海馬CA1から大脳皮質聴覚野の相互作用を調べるため、麻酔下のモルモットの海馬CA1に電気刺激、聴覚に音を提示して大脳皮質聴覚野に生じる応答を記録した。大脳皮質聴覚野からの応答の記録には膜電位感受性色素による光計測法やマルチユニット計測を用いた。この膜電位光計測法は大脳皮質聴覚野のほぼ全域の細胞から同時に応答を記録することができ、また同時にms オーダの時間分解能があることから聴覚応答のような速い現象の解析にも適している。この実験では蛍光型の膜電位感受性色素RH795(濃度0.125 mg/ml)を用いて大脳新皮質聴覚野を染色し、クリック音(100 µs, 65 dB SPL)によって生じる活動を高速MOS型撮像カメラを使って記録した。海馬CA1へは双極のタングステン電極を刺入し、0.19 mAで100 µsのパルスによって電流刺激を与えた。その結果、海馬CA1への電気刺激と音刺激のタイミングに依存して聴覚野に生じる神経活動が修飾されることが明らかとなり、その応答は通常(音刺激単独の場合)に比べて抑制された(Yamamoto et al., 1999)。この現象は、聴覚皮質に感覚情報と海馬情報の間にタイミングに依存したゲーティング(タイミング窓)が存在することを示している。さらに、海馬CA1の活動の違いによって聴覚野の応答に異なった影響が生じるかを調べるため、海馬CA1の電流刺激の強度を0.19 mA, 0.38 mA,0.57 mA,0.76 mAと変化させて聴覚野の応答を比較した。電流強度を変化させることは、海馬CA1内に活動が生じる領域の大きさを変化させることに相当する。その結果、電流強度が0.38 mA以下では海馬への刺激は聴覚野の応答に対し抑制性に働くが、0.57mA以上では興奮性に働くことがあきらかとなった。このように海馬CA1の活動によって、聴覚野の応答に対し抑制性と興奮性の修飾は、海馬から大脳皮質聴覚野へ情報を書き込む際の情報処理能力を高めている。また、この応答変化を詳しく解析した結果、海馬刺激による聴覚野応答の修飾は、空間的には聴覚野の腹側より背側で応答変化がより大きく、時間的には音刺激単独の聴覚野のピークから20〜40 ms経過後の応答がより大きな変化が生じた。このように、海馬活動の違いによる大脳新皮質聴覚野応答への影響は時空間的に修飾されることが明らかとなった。

(2) 連合学習前後の応答
 海馬-大脳皮質系の記憶システムが,実際の連合学習過程においてどのように機能しているかを解明することも重要な問題である。このような学習過程での海馬-大脳皮質系の役割を調べるための実験パラダイムとして、古典的条件付けの一種である、音と電気刺激による恐怖反応条件付けが有効である。恐怖反応条件付けは情動記憶の研究から受容野可塑性の研究まで幅広く用いられているが、少ない試行回数で強い条件付けが成立し長期間持続するという特徴がある。塚田らは、恐怖反応条件付けの際の海馬-大脳皮質系の情報処理を明らかにするには、大脳皮質聴覚野の活動変化の測定には膜電位光計測法を用い、また、海馬の活動変化の測定には微小電極法を用いるのが最も効果的であると考えた。膜電位光計測法の実施が麻酔下でないと難しいことから、条件付けはケタミン麻酔下で実施した。条件付けは、条件刺激(ConditionedStimulus;CS)は持続時間5 sで周波数が12 kHzの純音とし、無条件刺激(Unconditioned Stimuls;US)である後ろ足への電気刺激は持続時間0.5 sで電流強度を0.5-1.5 mAとした。音の直後に電気刺激を行ない、これを1試行として試行間隔を60-120 sでランダム変えながら合計70試行を行なった。また、同時に心電図を記録し、条件付けが成立するか否かを心拍変動によって確認した。膜電位光計測では膜電位感受性色素の退色や、光損傷、色素の毒性による細胞活動低下などの原因のため、記録開始から長時間経過すると応答の強さや応答面積はほとんどの場合減少する。 この実験では、ここまで説明してきた条件付け群(Normal)の他に、音刺激や電気刺激の回数は一致するが刺激タイミングによって条件付けが生じない疑似条件付け群(Sham)を用意した。擬似条件付け群では、条件付け群とは逆の電気刺激の後に音という順序にし、電気刺激と音の間隔、音と電気刺激の間隔は全て30-60 sでランダムとした。条件付け群と疑似条件付け群の比較した結果、条件付け群のCS音(12kHz)の応答面積変化率(応答面積の増加)が他の組合せ(4,8,16kHz)と比べて統計的に有意となった。このように、膜電位光計測法を用いて恐怖反応条件付けにより生じる大脳皮質聴覚野の応答変化を世界に先駆けて計測するのに成功した。

(3) 海馬-皮質記憶系のモデル
 皮質では、記憶は神経細胞の興奮パターンによって表現され、細胞間のシナプス結合を変化させる学習則によって神経回路網に安定なパターン(アトラクタと呼ぶ)として記銘され、その数によって情報容量が決まると考えられている。出力から入力へのフィードバック結合を持つニューラルネットワーク(再帰的ネットワーク)は、与えられた入力に対し出力を計算し、その結果をフィードバックして入力を修正しその入力に対して出力を再計算する。このような処理を何度も繰り返すと、安定なネットワークでは出力値の変化が少なくなり、一定の出力値(平衡点)をとるようになる。力学系では、平衡点をアトラクタ、アトラクタに達する状態の集合を引込み領域と呼ぶ。このようにアトラクタ構造を創ることによって、皮質では長期記憶を実現していると考えられる。塚田らは生理実験にもとづいた海馬-皮質系のモデルを提案し、文脈にもとづく記憶書き込み、および読み出しのモデルを実現した。このモデルは次の2段階の機能からなる。
1段階:塚田らの提案した時空間学習則が有効に働き海馬神経回路網に時空間の出来事の文脈を作る。
2段階:ヘブの学習則により連合野に出来事の類似性の構造(距離空間)を持つ強固なアトラクタ構造を作る。
 このモデルでは海馬の文脈情報と感覚入力のキーパターン情報が長期記憶の入力となる。実験結果に基づいて、感覚情報と海馬情報の間にタイミングに依存したタイミング窓を一致性検出回路として導入している。このモデルの計算機シミュレーション結果によれば、海馬の文脈情報の導入により引き込み領域が拡大するとともに、書き込み及び読み出し時間が著しく改善され、記憶パターンの正解率も向上した。また、引き込み領域の拡大は、CS音を聴かせた場合のみ聴覚野の応答面積の有意な増加がみられた実験結果を説明していると考える。
(4) 推論実験(坂上雅美、津田一郎、塚田稔)
 生活体にとって、現在の刺激布置から後の事象生起を予期する能力は、生存にとってきわめて重要なものであると考えられる。これまでにも、心理学的・神経科学的研究において生活体が報酬の到来を予期すること、報酬予期に関する情報がPrefrontal cortexに符号化されている可能性が示唆されてきた。しかしながら、こうした研究の多くは当該刺激が直接的に報酬と結びついている場合が多く、他の刺激やカテゴリーを媒介とするより高次な報酬予期に関しては不明な点が多い。今回の研究では、sequential associative task(もしくは象徴見本あわせ課題による条件性弁別)によって構成された二系列のグループを媒介した報酬予期課題をニホンザルに学習させ、課題遂行中のサルの前頭前野からニューロン活動を記録した。
 被験体として二頭の雄ニホンザルを用い、6種類の視覚的に弁別可能な刺激を用意した。注視点の呈示の後、第一刺激(A1もしくはA2)が呈示され、遅延の後に第二刺激(B1及びB2)が呈示され、サルはサッケードによる選択反応を要求された。正反応が生起した場合には第三刺激(C1及びC2)が呈示され、サルが正反応を示した場合には報酬が与えられた(以下、double saccade block)。サルが誤反応を示した場合には、試行を一旦打ち切った後に同一の試行を誤反応の時点から繰り返す修正試行を挿入した。サルがA1-B1-C1およびA2-B2-C2という刺激系列を十分に学習した後、C1とC2の一方に大報酬を、他方には小報酬を呈示する教示試行とdouble saccade blockを交互に行った。Double saccade blockにおける各系列に対する報酬量は、直前の教示試行におけるものを用い、特に第一刺激呈示中に注目して前頭前野の神経活動を記録した。
 訓練を通じてサルは、double saccade blockにおける刺激系列を正しく学習することができた。教示試行において、サルは小報酬試行よりも大報酬試行で有意に短い反応時間を示し、報酬量に応じた反応の分化が確認された。Double saccade blockにおいてもこの傾向は確認され、大報酬系列が有意に短い反応時間および高い正反応率を示した。特に注目すべきはdouble saccade blockの第1試行の結果であり、サルは教示試行直後の第1試行からこうした反応分化を示した。これは、double saccade blockでの各系列と報酬量の関係を教示試行でのC1もしくはC2と報酬量の関係から適切に予期し、反応を制御していたことを示唆する。
 前頭前野からの神経活動記録においては、特にA1もしくはA2呈示によって誘発された反応から、報酬依存型(R type)および刺激−報酬依存型(SR type)のニューロンが見出された。R typeは、呈示されている刺激や系列に依存せず、大報酬が予期される試行、もしくは小報酬が予期される試行に限定して強い応答を示した。また、SR typeは特定の刺激と報酬量、もしくは特定の系列と報酬量に依存して強い応答を示した。こうした結果は、前頭前野においては刺激によって喚起される報酬予期のみならず、連合によって相互に結びついたグループと報酬の関係が符号化されていることを示唆している。


A01班
A02班
A03班
A04班
B01班
B02班
B03班
ゲノム班