ストロークと心理ゲーム、人生脚本について

エリック・バーンの唱えた「心理ゲーム」あるいは「人生脚本」の考え方について。基本的な考え方から系統立てて書いてくれているページが（原著を含めて）あまり多くなかったので、自分なりの解釈をここにまとめておく。

ふつうの解説的なものの中ではこの@ITの連載が一番わかりやすかったと思うので、そちらを参照してもらうとより詳しい部分がわかると思う。

自分の中に世界のモデルを作る、ということ

いろいろ考えた結果、エリック・バーンの提唱した考え方は、おそらく「世界のルールを自分なりに理解する」という枠組みによってわかりやすく理解できるのではないかと思った。そこで「世界のルールとは何か、どうやってそれを学んでいくのか」ということから考えていくことにする。

人を含めて多くの動物は、自分自身の頭の中に「世界のモデル」を持っている。ここで世界のモデルと呼んでいるのは、たとえば「ここで自分が皿から手を離せば、皿は地面に落ちて割れてしまう」というような物理的な理解だけでなく「人間とは利己的なものである」というような信念、あるいは「広い一戸建てを持つことが社会人にとって重要である」というような価値観も含む。自分の今生きている世界がどのような理屈で動いているかについて、具体的なものから抽象的なものまで色々なレベルで持っている知識をまとめたものが、ここで言うところの世界のモデルである。

しかし誰も、世界のモデルが全て備わった状態で生まれてくるわけではない。人間の場合、いちおう目や耳から入る情報がある程度脳に伝わり、あるいは脳の活動によって腕や足がある程度動くように、そこそこ配線された状態で生まれてはくる。しかし赤ん坊や幼児は、基本的には「社会人とはこういうものである」というような価値観を理解しているわけではない。

芥川龍之介の「河童」では、胎児の河童が生まれる前に「この世界に生まれてきたいか」を尋ねられて、自分でそれを選ぶことができる、という話が出てくるけれど、人間の場合はこのような（高尚な？）ことはできない。気付いたらこの世に生まれていて、否が応でも世の中のことを学びながら成長していくことになる。一部の物事（箸の持ち方とか、お金の使い方とか）は大人たちが明示的に教えてくれるけれど、ほとんどの物事（人生に何が大切かとか、自分が何者であるかとか）は暗黙的にしか示されない。なんとかして自分で学んでいくしかない。

強化学習の考え方

このようにどれがヒントかわからない状態で、人間や動物はどのように学んでいくというのか？

ひとつのフレームワークとして考えられるのが、強化学習の考え方である。たとえば全くルールのわからないゲーム（全く新しいパチスロの台とか）をしていたとしても、どこかのタイミングで玉がたくさん出てきたりすれば「これまでのタイミングのどこかで、自分が何か『正しい』ことをしたのだ」、という感覚になることができる（強化学習の用語では「報酬」にあたる感覚）。それまでの自分の行動のどれ（もしかしたら特定の行動の組み合わせかもしれない）が実際にその出玉（報酬）に結びついたのかはまだわからないけれど、それは自分のこれまでの行動のどれかが起点となった可能性が高い。そこで今までしていた行動を色々試していくと、どいういうときにたくさん玉がでてくるのかが少しずつわかってくる。

最初は「激しい音が出始めること」だとか「目の前の絵が目まぐるしく変化すること」だとかが出玉を予想するサインだと気づき、そのうち「この穴に玉が入ることが重要なのだ」ということがわかってくる。このように、「たとえ報酬が与えられることが少なく、ルールが明らかでなくても、そこから逆算して試行錯誤していくことで少しずつルールと戦略を自分なりに理解していくことができる」というのが強化学習の考え方の基本になる。

このような方法論を用いることで（もちろんその他の様々なトリックも使うけれど）、たとえルールについて初めまったく無知であっても戦略的に行動できるようになる。最近のAIの隆盛が、そのひとつの証左である。ブレイクスルーとなったのは「AIが人間並にテレビゲームをできるようになった」という論文だけれど、現在では2速歩行のロボットにパルクールを仕込むとか、ロボットにけん玉を仕込む、といったことができるようになってきている。

強化学習の方法論を用いることで、どんなに複雑なルールであっても、そして時に教える側さえ何がコツなのかよくわかっていない場合でも、少なくともルールを学んでいくことが可能になる。

動物と人間の報酬システム

それでは人間を含む動物では、何をすれば報酬となるのか？実際にはその詳細は完全にはわかっていないのだけれど、少なくともドーパミンという物質が脳内に分泌されることが重要であるということは確からしい。サルやネズミに電極を挿し、彼らが特定のボタンを押したときにドーパミンが分泌されるようにすると、彼らは最終的にはボタンを押し続けるようになってしまう。人間でもコカインの麻薬としての効能・中毒性は、ドーパミンの作用を増幅できることに由来する。世の中の人がたまにつかう「脳汁」という表現も、おそらくはドーパミンの分泌に近いものをさしていると考えられる。

直接的にドーパミンを分泌させなくても、動物にとって「快」となるようなルールを強制的に作ってやることで、特定の行動を取らせることができるようになる。餌を使った犬の躾では、犬が特定の行動を取れた時だけ餌をあげるようにしたり、特定の行動を取れなかった（あるいは悪い行動をした）ときに罰を与えたりすることで、特定の文脈で特定の行動をとれるように学習させるものである。犬の例は最もよく知られたものだけれども、ハトやネズミ、サルのような他のネズミでも同様のことができる。最近（といってもここ半世紀くらい？）は、発達障害などの子供に対しても似たような方法を用いることで、最低限困らないレベルの行動を学習させることもあるようだ。このように直接的に脳内報酬に頼らなくても、「アメとムチ」を適切に与えることによって行動を学習できるのは、おそらく動物がもともと強化学習的に世界のルールを学んでいることによるのだと考えられる。

ストローク：人間特有の報酬システム

もちろん人間も動物の一種なので、動物と同じように食べ物や水を「報酬」とすることはできる。ただ人間に特有なのは、コミュニケーションを用いて他者の行動を肯定・否定できること である。ほとんどの人は、たとえば褒められたり感謝されたりすれば悪い気はしないし、逆に叱られたり不満を述べられればおそらく心がささくれ立つだろう。食べ物のような直接的な報酬を使わなくても、たとえば言葉を投げかけるという行為そのものが「報酬」あるいは「罰」として働きうるのである。

エリック・バーンは、このようなコミュニケーションを通じた報酬あるいは罰のことをストロークと呼んだ。おそらく意味合いとしては、テニスやゴルフにおけるストロークのように、相手に言葉というボールを打ちかける行為、ということなのだと思う。

ストロークの考えかたでとくに重要なのは、相手に投げかけているコミュニケーションに「自分という人格の肯定・否定」、「相手という人格の肯定・否定」のニュアンスを載せている、という点である（いちおう個人的には「自分の肯定・否定」という側面も重要なのではないかと思っているのだけれど、以下に出てくる議論ではほとんどの場合「相手の肯定・否定」の意味でストロークという言葉が使われる）。たとえば相手に対して感謝したり褒めたりするのは「肯定的なストローク」、逆に貶めたり叱ったりするのは「否定的なストローク」と呼ばれる。基本的には、肯定的なストローク（報酬）を受ければ受けるほど、それを与えられた人は自己肯定感が強くなるだろうし、否定的なストローク（罰）が多いほど自己否定感が強くなると考えられる。

コミュニケーションは必ずしも言語的である必要はない。たとえば撫でるとか抱きしめるとか、あるいは体罰のような、そういった身体的なコミュニケーションでも肯定的あるいは否定的な意思表示をすることができる。その意味では、言語を習得するもっと前から、ストロークの応酬・受容は始まっていると言える。

ここでエリック・バーンが着目したのは、「ストロークがないよりは、否定的でもあった方がまし」という点である。たとえばクラスに気になる女の子がいる小学生の男の子の場合、相手とまったく接点がなくてなんのやり取りもできないのに比べれば、文句を言われてもいいから嫌がらせをしてなんらかの反応をもらえた方がまし、ということに対応するのだろう。世にいう「愛の反対は無関心」というのに近いと思う。

最初の「世界のモデル」のところで出てきたように、人間は報酬や罰を通して自分のいる世界のことを学んでいく。とくに社会的な世界のルールは、肯定的あるいは否定的なストロークを通して学んでいくことになる。ただし報酬も罰もない状況では、何をどう学べば良いかわからない。この混乱がおそらく不安要素となり、「なんでも良いからストロークがほしい」という状態につながるのではないだろうかと思う。

思うにエリック・バーンの考え方の根本には、「全ての人間は、肯定的であれ否定的であれ（大なり小なり）ストロークを求めて生まれてくる」という社会性の仮定のようなものがある気がする（もちろんその後の人生でいろいろなことを学ぶので、大人がどこまでストロークを求めるかについては状況がより複雑になりうる）。

心理ゲーム：ストロークを得るための戦略

ストロークを得るために人々が獲得する（とエリック・バーンが主張する）のが、心理ゲームと呼ばれるものである。これは強化学習に引きつけて言えば、「ストロークを通じて学習していくコミュニケーション上の行動戦略」と言える。

シンプルな例で言えば、子供の「お手伝い」が挙げられる。たとえば食器を並べたり片付けたりするというお手伝いをすることで、子供は親や保護者に「感謝される」ということを学ぶ。これが肯定的な動機付けになって、子供は感謝という肯定的なストロークを得るためによりお手伝いをしたがるようになる、というものである。

ここで重要な考え方は、「感謝を通じて子供がいい子になった」と捉えるのではなく、「『よい子』という役割を演じるために、子供がお手伝いという行動戦略をとった」と解釈するということである。ひねくれた考え方かもしれないけれど、「子供がいい子であるかどうか」はあくまで親あるいは保護者の視点であり、そちら側からの一方的な価値判断でしかない。そして子供の側が、「お手伝いは本質的に善いことである」と認識している必要もない。子供としては「こうすれば感謝される（そして嬉しい思いができる）からそうしている」というだけの可能性は多少なりともあるだろうし、実際に子供のときにそのように考えて行動していた記憶のある人もいるかもしれない。学ぶ側からすれば、コミュニケーション自体が報酬を得るための手段であり、世界の仕組みを再確認するための「ゲーム」だと言える。

この考え方の有用な点は、典型的な「よい子」では必ずしもしないような行動についても説明できることである。よく出てくる例で、「子供が『自分がいかにバカか』を親に認めさせる」というものがある（ちょっと長いですが）：

子　「僕はバカなんだよ」

父　「おまえはバカじゃないよ」

子　「いや、僕はバカなんだ」

父　「バカじゃないよ。夏休みのキャンプのとき活躍してたじゃないか。先生がお前のこと褒めてたぞ」

子　「先生がそんなこと褒めてくれるわけないじゃないか」

父　「いや、先生から直接聞いたんだって」

子　「親には良いように言うもんだよ。先生は僕のこと、バカって言っているよ」

父　「そりゃ、冗談で言ってるんだよ」

子　「いや、バカなんだ。学校の成績を見りゃ分かるじゃないか」

父　「バカじゃない。勉強はやればできるんだよ」

子　「努力はしているよ。でも頭が悪いんだよ。タネも悪いし」

父　「頭は悪くない。もっと努力したらどうだ？」

子　「でも、どうせバカなんだよ、意味ないじゃないか」

父　「やってもみずに言うんじゃない！」

子　「どうせバカだから無駄なの！」

父　「バカじゃない！」

子　「バカだ！」

父　「バカじゃないって言ってるだろ!! このバカ野郎！」

この例では、親の視点からすると「どうすれば子供に自分の価値をわかってもらえるのか」というふうにみがちだけれど、「子供が否定的なストロークを得るために仕掛けている行動戦略」だと考えると比較的理解しやすい（そこに解決策がある、と言っているわけではない）。そもそも子供側のゴールが「親から『お前はバカだ』と言われる」なら、どれだけ説得しようともそれに応じるわけはない。

幼少期の発達に絡めたエリック・バーンの解説としては、「このような否定的な心理ゲームは、ストロークの不足によって生まれた」というものである。肯定的であれ否定的であれ、じゅうぶんなストロークが得られなかったと感じた子供が「なんとかして構ってほしい」という動機で生み出した戦略が心理ゲームなのだと言える。子供側からは、その心理ゲームを肯定的なものにできるかどうかをあらかじめ選ぶことができない。肯定的なストロークすら得られていなければ、今までの行動から得られた体験から「最もストロークが得やすい行動戦略」として否定的ストロークを得るゲームを選んでしまう可能性はじゅうぶんにある。

また心理ゲームの獲得に当たり、「子供側でストロークを得るための戦略を筋道立てて立てられるか？」というポイントも重要になる。たとえ肯定的なストロークがある程度与えられていたとしても、たとえば親がものすごい気分屋だったりする場合、子供側で「特定の行動が肯定的なストロークにつながる」ということが分からない可能性もある。その場合、必ずしも心理ゲームとして、肯定的なストロークを得るための戦略が選ばれるとは限らない。このあたりはAIの学習に通じるところがある。「ただ褒めたり感謝したりすればよい」というわけではなく、コミュニケーションを取る側に筋の通った理が（おそらく）必要になるのも、難しい点だと思う。

交流分析：心理ゲームの役割分担

先の節で少し出てきたように、人間は（大人であっても）必ずしも筋の通った振る舞いをするとは限らない。気分やコミュニケーションの相手、その時の状況によって、その人の行動は簡単に変わってしまう。「心理ゲーム」という観点から眺めることで、コミュニケーションのありようを「主張のやりとり」ではなく「複数の人間が、自分のほしいストロークを得るために即興で作る演劇」と捉えることができるようになる。こうすることで、その即興劇の中で個々の人間がとる行動を「役割」として抽出しつつ、なお個々の人間の「本質」のようなものを議論することができるようになる。

即興劇における役割をより体系化したものが、エリック・バーンの提唱した交流分析だと考えることができる（たぶん）。詳しい説明は他の記事にしてもらうとして、基本の役割は以下の(2 x 2 + 1)種類に分けられる：

Parent（P; 親のような役割）：相手を気にかけ、育てたいという立場。
- Critical parent (CP; 批判的な親)：これは善い、これは悪い、とルールを示して自他を律する役割。
- Nurturing parent（NP; 優しい親）：支援的な立場から相手をサポートする役割。
Adult（A; 大人の役割）：論理的、客観的に状況を整理する立場。感情に流されず、冷静に判断する役割。
Child（C; 子供のような役割）：自分本位に感じたり行動する立場。
- Free child（FC; 自由な子供）：もって生まれた無邪気さや直感、創造力を発揮する役割。
- Adapted child（AC; 順応した子供）：誰かの言いつけに従って振る舞う役割。

重要なのは、特定の即興劇には特定の役割のペアがあって、個々の人間のどちらかがどちらかの役割を演じる必要がある、ということである。上で出てきた２つの心理ゲームの例では、どちらも子供の方がACの役割を、大人の方が（多少なりとも）CPの役割を担っている。現実の社会生活でも、たとえば誰かが誰かを叱る、という状況では、叱る側がCPの立場を、叱られる側がACの立場をとりやすい。逆に片方がNPとして「サポーター」のような役割を取っている際には、相手がFCの役割をとることができないとうまく場がもたない。また会社の会議のような場では、参加する全員がAとして振る舞えなければ、重要事に冷静にあたることができない。このように、コミュニケーションあるいは心理ゲームという即興劇において、様々な場面の人々の振る舞いを、上の5つによって類型化してとらえることができる。

そして上記の５つの役割は、一人の人間の中で共存しうる。言うなれば「即興劇の役割」でしかないので、状況に応じて色々に出し分けているだけなのである。

むしろエリック・バーン的には、上の５つの要素を状況に応じて適切に出せる人間が「よく成熟した人格」であると考えている（のだと思う）。ただしそういうことのできる人はそれほど多くないし、ほとんどの場合はどれかの要素が全面に出過ぎていたり、あるいは出てこなさすぎたりして、凸凹の様相を呈しやすい。あるひとはどのような場面でもCPとして振る舞いたがったりするし（いわゆる「老害」というのはそういうものなのかもしれない）、人によってはどんな場面でもACになってしまう場合がある（「キョロ充」と呼ばれる人の性格は、これに近いのかも）。

ただし、強化学習の（そしてエリック・バーンの）観点から見れば、そのような凸凹は「いままで経験したストロークの偏りから、そういう行動戦略だけが前面に出てきてしまっている」状態でしかない。言い換えると、今ほとんど出てこないような役割であっても、様々な即興劇で意識的に練習していくことで、その役割に対応した行動戦略を身につけて（あるいはより前面にに出して）いくことができる、ということでもある。そういう意味で、交流分析的な視点は、自分というキャラクターに満足いかない人にとっての改善のヒントになりうる考え方でもある。

人生脚本：自分にとっての自分の人生、自分の世界

ここまでは、コミュニケーションの特定の文脈における行動戦略として、心理ゲームや交流分析を考えてきた。そこからもとの議論（世界のルールを学ぶ）を振り返って考えてみると、「個々の文脈における戦略から、どのように世界のルールが立ち現れてくるのか？」という問題が出てくる。

じっさいのところ、個別のケースからより一般的なルールへの抽象化がどのように起こるのかはよくわかっていない。まあ「100の条文を覚えるよりも1の原理を覚えた方が応用力は高くなる」可能性があると思うので、少ないコストで様々な場面に対応するための戦略として「抽象化・一般化を志向する」というのはありなのかもしれない。とくに世の中に転がっている解説でも、一般化がなぜ起こるのかについて真面目に議論している雰囲気はない。

なんにせよわかっているのは、個別のケースを包括的に解釈する流れの一環として「一般化」という現象が起こる、ということである。たとえば日常の様々な場面で「これはダメ、ああしなさい」といった指示を親から受け続けた子供は、「自分は判断してはいけない、指示に従わなければいけない」あるいは「自分は判断することのできない人間である」といった一般的なルールをつくる可能性がある。

さらに人生というものが人との（あるいは自分との）コミュニケーションを軸にして成り立っていると考えれば、「自分がどのような心理ゲームを持っていて、どのような役割を演じるか」という行動戦略的な側面も重要になる。

これらの自己認識、人間関係のルール、自分が摂れる行動戦略といったものを総称したものが人生脚本である（のだと思う）。３行くらいでまとめると、人生脚本は大まかにいかのような構成要素からなる：

この世の中はどのようにできているか
自分はそのなかでどのような位置付けで、どのような役割を演じるか
自分と周囲はどのようなドラマを演じて、最終的に自分はどのような結末を迎えるか

これも心理ゲームや交流分析の場合と同様、「幼少期からの発達過程を通じて、今までに経験した事柄から類推した精一杯の仮説である」ということに着目するのが重要だと思う。幼少期に見えていた世界の全てが、大人になって見えている世界のなかのどのくらいの割合を占めているか？おそらくごく一部でしかないのではないか。そのごく一部の中の論理をベースに解釈した人生、あるいは世界のルールが「一般的」である可能性はそれほど高くないと考えられる。心理ゲームと同様、「脚本」として自分のなかの信念を相対化することで、できるだけ客観的に自分の価値観をみることができないか、というのがエリック・バーン的な考え方なのだと思う。

禁止令とドライバー：ルールを一言に集約する

この中でエリック・バーンがとくに重視するのが、「べきだ論」的な信念である（と思う）。これは人生脚本の核となるような、さまざまな事例をもとに一般化された行動指針である。御伽噺でいうところの「教訓」のようなものとも言えるかもしれない。

これらの信念は、大まかに以下の2種類に分けられる：

禁止令：「〜であってはいけない」という形を取る。「幸せになってはいけない」「考えてはいけない」など。
ドライバー：「〜でなければいけない」という形を取る。「完璧でなければいけない」「家族を大事にしなければいけない」など。

まあこのへんの言葉はただわかりやすくするためのラベルづけでしかなくて、重要なのは「〜であるべきだ」という形式をとる、という点になる。

哲学における善悪の議論でよく出てくるのが「『である論』から『べきだ論』は出てこない」というものである。「〜である」というものは物理的な世界の一般論を説いているだけだけれど、「〜べきだ」というのはそこに善悪の判断が入ったものであり、性質が違う。物理現象はあくまで「〜である」の集合なので、それをどれだけ一般化しても「〜である」の形にしかならない。「〜べきだ」という善悪の判断は、人間が特定の価値基準に則して自分の行動を決定する際にしか出てこない。その意味では人間の（もって生まれた）創造性を縛る効果のあるルールである、とも言える。

じっさい、ネットに転がっている解説によると、禁止令やドライバーは人生に関わる重要な決定で顔を出すことが多い、らしい。たとえば「今の仕事を続けるか、転職するか？」というような決定において：

「幸せになってはいけない」という禁止令を持っていれば、たとえば「『転職して楽になる』なんて考えを自分が持ってしまってよいのか？」という疑問として自分を縛りうる。
「考えてはいけない」という禁止令なら、たとえば「みんな反対しているのだから、アドバイス通り今の仕事をしていたほうが良いのでは？」という考えが頭をよぎることになる。
「完璧でなければいけない」というドライバーなら、たとえば「今の仕事をこんな中途半端で投げ出してしまってよいのか？」という自責、あるいは「ほんとうにきちんと考えた結果の結論が出せているのか？」という疑問が生じるかもしれない。

このときの特徴はおそらく、AC（順応した子供）としての恐怖が自分を縛ってしまっているところだと思う。本来ならA（大人）として理性的な決断をした方がよいだろうに、「親がなんというだろうか？」「上司にどんな顔をされるか？」といった考えに苛まれてしまうことで考えに歪みが生じうる。もちろん、自分がCP（厳しい親）として意識的に「この信念が自分にとって大切だ」と思っているならそれも悪くはないのだけれど、ACとしての感覚が無意識的にそうさせている場合は「自分自身の人生を生きられている」という感覚を損ない、どのような結果になっても自己肯定感の低下を招くかもしれない。

おそらくこのへんのコアの信念を見つけてそれをなんとかすることで、いまよりなんぼかマシな人生にしてみようぜ、というのがエリック・バーン的な考え方になるのだと思う。自分の行動を縛る信念というのはそれなりに愛着（執着？）があるものも多いと思うので、それをなんとかしようというのがもともとの考え方になるだろう。具体的には：

強化学習的に見ることで、「自分がこのような信念や戦略を持っているのはたまたま、そのような順番で今までの経験をしてきたからである」ととらえる。
「ゲーム」あるいは「脚本」という「おはなし」のかたちに抽出することで、できるだけ他人事として、個々のやり取りでの自分の演じる「役割」を客観的に捉えられないか試みる。
自分の経験したことの少ない「役割」に意識的になって、個々の場面で特定のおはなし・戦略に則ることができないか、試行錯誤してみる。

といった方法論に帰着するのではないだろうか。

大器无成

大器はその大きさゆえに、決して完成することはない