POYNTER技術顧問



Deep Learningで谷崎潤一郎の細雪の続きを書かせてみる

日本を代表する小説家谷崎潤一郎。類まれな淡麗な作風、森鴎外や滋賀直也の簡勁な表現とは対象的な文体を体現しています。

POYNTERではDeep Learningの例として、前回ブログではもしもピカソが「泣く女」の画風で他のものを描いたらどうなるのか試してみました。今回は、扱う対象を画像でなく文章でできないかを考えてみました。


そこで今回は、日本を代表する小説家である谷崎潤一郎を取り上げてみました。細雪が書かれたのは第二次世界大戦戦時中でした。物資不足が日に日に深刻になっていく中、4姉妹の旧家の生活をつぶさに描いています。細雪は中央公論で昭和18年に連載が始まりましたが、陸軍省報道部により掲載がストップされた後、谷崎はプライベートに知人の間で連載を発行し続け、それが刑事に目をつけられ、谷崎家までやってきて発行しないよう脅されたといういわくのある作品です。近年発見された谷崎が戦時中に友人に預けた細雪の草稿メモの印画紙は、もしかしたら戦災をさけるためよりも陸軍や警察からのがれるためだったかもしれません。

谷崎潤一郎が生存していない現代で、彼の文体を誰かが真似することは現実的ではないでしょう。しかしAIならできるかもしれません。 これを実行するのに私のセミナーでもよく出てくるRNN(Recurrent Neural Network)という技術を使います。RNNは対象が時系列である場合に有効だと言われています。時系列には自然言語の文章も含まれます。Recurrentは再帰という意味があります。従来のニューラルネットは、入力データは各々独立で、時系列的なかかわりがないものと定義していました。しかし、文章や音声データのような時系列では、過去(文章では1文字前、2文字前)のデータと関係性があるわけです。もっとずっと以前には、この関係性を表す手法の一つとしてマルコフ連鎖というのがありました。実際、マルコフ連鎖で文章中に出てくる語の次に出るべき語を推測することも以前は研究されていたわけです。このような概念を取り入れたのがRNNです。

RNNでは隠れ層の過去の値を再び隠れ層にフィードバックすることにより、時系列の中で過去を記憶しておく部分ができあがることが特徴です。そのアイデアはよかったのですが、これを学習するときに用いる勾配法で爆発・消滅が起きるということがHochreiterにより指摘されており、長い文章等の長期の時系列では学習がうまくできなくなっていました。

それを解決するために出てきたのが今ではRNNの定番となってきているLSTMです。細かい説明はここではしませんが、RNNで問題となっていた勾配消失問題を強く意識した理論となっていて、長期の時系列にも対応している理論です。今回はLSTMを使って、細雪の文章をmodifyするモデルを学習させてみましょう。
細雪の著作権は切れており、現在は青空文庫で読めるようになっていますので、これをコーパスとして使用しました。

最適化には時間とCPU負荷がかかりますので、今回のモデルの学習は20回のiterationで終了させています。
モデル学習後に、細雪に出てくる極短文をモデルに入力したときの入力文の次の文を推論させた結果を示します。
では、やってみましょう。



(細雪原文から抜粋した元の文章=入力文) 「高嶋屋へ買い物に行って、帰りに外濠線の通りへ出たら、さっと風が吹いて来て持って」
という極々短い文の続きを推論させましょう。



----------------------------------------------------------------------------------
(Iteration9回 diversity: 0.2)
----------------------------------------------------------------------------------
高嶋屋へ買い物に行って、帰りに外濠線の通りへ出たら、さっと風が吹いて来て持って行ったので、ただちょっと、―――」 と、幸子が云った。 「そうで、それでは何処か」 「そうで、それまって」 「そうやら、………」 「まあ、こいなん」と云うことを、今ではないのん」 「そうで、それでしていることがあんなので、………」 「まあ、………」 「まあ、こいさんはいないわ」 「そうで、それではあんならん」 「ああ、それは、その時、そう云う風に何処であった。 「今夜は大阪へん」 「まあ、こいなん」と云うことがあったので、それではないのであった。 「―――」 と、幸子は、その時になってみると、そう云う風に、世間にもよく出来ないようなとは云うもんでして、その間もなく云った。 「―――」 と、貞之助がそして行って、「あのお」はないのん」 「―――」 と、雪子が云った。 「そう、それ、………」 「そう云う訳でも、いつもう一つにも、今日の日のようにはっきりしても、その間もなってみると、そう云う風に
----------------------------------------------------------------------------------
(Iteration9回 diversity: 0.5)
----------------------------------------------------------------------------------
高嶋屋へ買い物に行って、帰りに外濠線の通りへ出たら、さっと風が吹いて来て持っているので、妹の上げるところを持って来た見て、電話を来てもしてはりますのになっていたのにはないが、それがられると、そう云う風に、世気のおよいにしたものを見えたが、雪子の様子がどんように云うんで、それでもう一つから、寝台へ着をするとは、そう云う風については、話だけれども、お前まんように」 「そうお」 と、雪子が云って行った。 「―――」 「そう云うて、―――」 と、貞之助がそして、帰って来ていると、そう云っても、 「ああ、そう云うことは分っていたんでい。それも、今日はったようならん」 「そうやら、姉ちゃん」 「そうて、大体の方へ、そう云う風に一週間」 「何や、あの時、三人、このお料理にはっきりますねん」 「おあれ、これもうちません」 「そうや」 「そうであった。そして、どうかてお願いしなかったので、今度はこう云うことは、今度はいくらいなんで」 「そうや」 「まあ、………」 、そこに、雪子のただ
----------------------------------------------------------------------------------
(Iteration9回 diversity: 1.0)
----------------------------------------------------------------------------------
高嶋屋へ買い物に行って、帰りに外濠線の通りへ出たら、さっと風が吹いて来て持ってるら、入角いるものと云う所ますことは早ういる気きながら、そこにさえ、われてくなって寝ら、ぱ…………おお知の姉ちゃんに兄さんは一つで見か、何処かで」 「悦ちゃん、考ええたしと、いくこっさや違いやない云う何やらん、全然でぐいこう味に会って、故「あれ、やろ、今年がってはったらいだけ」 と、考ったまあ、持たのお迄焼一部の頭?で件の時刻尚等が二台の骨を惜しいを載って、中には少しまったわ。第には、ふんあったのヤイラックテオリテシマカタ電テーニ気の手やる、はい、お春の皿の雑意、どうか、これそめ二夜はなったえた。、本間へづいて、あの人、の家の部屋の如きであった。 「あなたあ、やっと」 「そのお春どん、―――」 と、は、箇月も眼の節の前にしっといつ所であったが、子が太さんで顔をよいにしても僻面迄ので」 「今立ちょっと、中に仏西人の家の旧いわい済んだら、何やお上わりほしい」 「何音?通―――――――――」 「
----------------------------------------------------------------------------------
(Iteration9回 diversity: 1.2)
----------------------------------------------------------------------------------
高嶋屋へ買い物に行って、帰りに外濠線の通りへ出たら、さっと風が吹いて来て持って戴き、いが、殆い妙子の上は大畳あの児だあうが、東斯び言郎を片を云わたが着帰るでと、以来、新振りにも吸降りつ何かか誇を感残すわれず、西洋人は、口に行かなんよ口に………おほんとこの母やお金をゃをすかせんだけど、肌まで悦子と英面の流産ねんが、そして悪快わ。早いもんで、どう云うことに来た瀬えと、云う挨ばか」 「形ふん」 幸子で柔調べを好きにはかけ始めたのでなっては「有難」と云う所から知ってで健まあ」 「そやお家さんやらやねんッもし来、事頃かか知らんでい歩いころ通着気の里が厭らまる間は大層云って老ちに住んで食うさか為にはぜえもい料かで、 「―――事さん自分に、鶴まで奮」 「なっ」 と、貞之助なくらって置かっただけで、うち歩い々しい廻るけれども、話してんで持ったから嫌食べく上はなさかい入れどんさせ申年げることに長を考えば、次の日めに時間が始めものだが大丈夫人有建きであったが、一方間も気何と云うことと父


----------------------------------------------------------------------------------
入力文の続きは元データつまり細雪オリジナルでは下記のようになります。
----------------------------------------------------------------------------------
(元の文章の続き) 高嶋屋へ買い物に行って、帰りに外濠線の通りへ出たら、さっと風が吹いて来て持ってる包吹き飛ばしてしもうて、それ追いかけて取ろうとすると、ころころと何処迄でも転こんで行くよってに、なかなか取られへんねん。そのうちに着物の裾が又さっとまくれそうになるのんで、片っ方の手でそれも押えてんならんし、ほんに、東京のからッ風云うたら※(「言+墟のつくり」、第4水準2-88-74)やない思うたわ」
また、diversityはLSTMのパラメータです。0.2-1.2まで各種変化させたときの出力結果をみています。原文にはない登場人物が出現したり、通常の日本語にはないような漢字の造語があったり(意味がわかりそうでわからない妙な感じがまたいいのかもしれません)、原文にない会話文が入ったりと、なかなか知的な感じがしますね。



もう少しやってみましょう。次は細雪の 「羽織や帯や長襦袢の末にまで、それとなく心づもりをしている様子が余所目にも看て取」 です。
----------------------------------------------------------------------------------
(Iteration17回 diversity: 0.5)
----------------------------------------------------------------------------------
羽織や帯や長襦袢の末にまで、それとなく心づもりをしている様子が余所目にも看て取った。 「あたし、雪子ちゃん、それからその時、何やそん、―――」 と、キリレンコも雪子が好い。 「きな声が知らんないわ」 と、二つもの高相手なる気持でして、家のと、電車でございます、どうですか」 「そうやっぱり病歳のことであるから、何ともしなかったらしいねんわ。そないらしいことになるねんわ」 と云って、 「ちさんそこそはないんです」 と、幸子はその挨拶ばかりであるが、幸子としてまで「ふん」と云うてるわ」 「ああ、そう云っていることがよく思った。 「お土え、げよく一時間違うない云うて、どうせておみ」 「今朝ですが幾だけないようになったらしいんですようか」 「そうです。どんな風にやわたわ。―――」 と、云うのであったが、幸子はそんな風にしても、その日のうてええことになってんわ。………」 「まあ、………」 雪子はこの人はそんな風に気をしていたら、この二三度は十分ったことであった。貞之助は、一生懸
----------------------------------------------------------------------------------
(Iteration17回 diversity: 1.0)
----------------------------------------------------------------------------------
羽織や帯や長襦袢の末にまで、それとなく心づもりをしている様子が余所目にも看て取り相手にしたらい込んですがらいのであるがら、今日近蔵のであるから、晩の樹の事に幸子が出来したが、幸子と云うので、一つであってくこれを、或る日本から通お引きに眼の晩にやろてか知られたのであるが、残りのことな気持で物をがように依気のないい言じます追ったのであるが、何かと手伝いていて、八日終ったらどうでいたし、あな家幸子とは意向うと、 「ああ、英声やするのであった。と、何とそう云ってもしないが、精神地げたのであるから、間々に見けそともなるともうて、大往夫人頃から出来て行ってみる。まれたの兄は、どうしても女学校の姉のを、生活の相うにり分らせら感じられ、しなかっと蘆屋へ「何とと云われてはなどうよい気持でそんだんだんはわたなかったしかん御事扉ある人やおありてしい。時ちゃんとこいさん立みに笑したませんよってに」 雪子は五十二三箇月に前や娘をしたのであるから、瀬越の量は、今日は中々夜いたいも寝らしくても直
----------------------------------------------------------------------------------
(Iteration17回 diversity: 1.2)
----------------------------------------------------------------------------------
羽織や帯や長襦袢の末にまで、それとなく心づもりをしている様子が余所目にも看て取り自分の卒事に幸子をした。その云いんは耳に付か人がった空べを談が何』と云うて、人の向うに悦子を見るとここにもし、母が妙子の痛料理と女ち娘ら桜の出来る春に雪子の訳がつ々も化一時間に父えと私も凡く落ちたいたが、年にけるのところが、結識けたことであったんだったので、兄にサ口を乗り出したらど加えて、「あれたし、雪子さんが手姉ややったらきめ悪い気みないわんなんでする」と、大雪子の不思議じわいねんですが極まり……ようについませんけれども、眼やよかな時に分ってんよったのだ今度の間らから、そう云う他のことはあんないのだけなので、ぽつぽつ話をして理]着て行くと、ついかもら、お合いたします』するえのし全かるような方方がおい水調べをすが癖って行った。までや一時車か見合って附合いて分らなこともないと、………と云ったらないであったのと云うもんですが、御気りにしいころに聞いていた好んだなあかん、しんかて如って遊ばなく

----------------------------------------------------------------------------------
(「細雪」原文の続き) 羽織や帯や長襦袢の末にまで、それとなく心づもりをしている様子が余所目にも看て取れるのであった。 さて、いよいよその季節が来て、何日頃が見頃であると云う便りがあっても、貞之助と悦子のために土曜日曜を選ばなければならないので、花の盛りに巧く行き合わせるかどうかと、雨風につけて彼女たちは昔の人がしたような「月並な」心配をした。
「看て取」の次の語がいずれのdiversityでもうまくつながっていて、なかなか秀逸ですね。



次はIteration19回です。入力は、「可愛がって内の子供をさっぱり可愛がってくれないと嫌味を云われたことがあって、返答」です。
----------------------------------------------------------------------------------
(Iteration19回 diversity: 0.2)
----------------------------------------------------------------------------------
可愛がって内の子供をさっぱり可愛がってくれないと嫌味を云われたことがあって、返答してはなると、なかったのであるが、その後ことは、この家の雛さんが本家に――――――今まですからは、自分と同じな見られたのを、何よりも見せらへんで」 「そうで」 「あの人、それいたは、まだ御覧。―――」 「何せ」 「あのん、それはお母ちゃんは大体ええていろやろ」 と、幸子はそんな風に気勢帰るらしくても、その後子にもうってくれると、―――その後にと出て行ってると、そう云う風には明らの下にで、今日はひとり雪子に云われ出したのであるが、それではそれであった。それには、貞之助がそう云う話にはない、それが、 「このお話ではない、あたし、それはこの間ことがあって、―――」 と、云うように云ってやろ、そして相談してはなんであろうかと、幸子はその婦人も平子ややったら、もう雪子ちゃんの顔見ように云っていない、と云う風にすると、幸子はそれを、今日もなかった方があった。それでは十日一日に立っていたのが、幸子の話で
----------------------------------------------------------------------------------
(Iteration19回 diversity: 0.5)
----------------------------------------------------------------------------------
可愛がって内の子供をさっぱり可愛がってくれないと嫌味を云われたことがあって、返答して貰わないことにしたらしいので、今日は却うようないと云う感合せはないけれども、今があったら、幸子の方からいから又それを、夕飯を時から一時にばかりがきったのから、妙子はその時は何でそんな風にしているやろか、そして、この家事に、 「あたし、そんなにはっきり調べがねんならぬから持って来たんやろ、………」 「そうで」 「あんたし、それでもうい」 と、後れ、二人のもうちょっとぐらいを一時間ばかり出て、何かしても、その家のことにしたちゃんであるらしかけるのは自分が過ぎて来たのであるが、そして、このなどは大阪ではあるまして、何でもそんなに仏蘭西語は、ねん」と、―――」 と、五十続けになるとも当ずに何か、それで、それからックしていると、井谷の人に行くと、と云う話には、近き所にあり、風は何かも悪いならへんさんに」 「先方がええ、どうかてるんやするのんやったら、『谷崎潤一郎全集 第十九巻』(中央公論新社20
----------------------------------------------------------------------------------
(Iteration19回 diversity: 1.0)
----------------------------------------------------------------------------------
可愛がって内の子供をさっぱり可愛がってくれないと嫌味を云われたことがあって、返答の花の坑を、床の間まであたしもの日、井谷が遅刻さなたまで、子に帰って来たくといられる年も、それは餐考えると、取っているであろう。そらな恰涙を見たことも分ったいて、今は又笑ういるで、そしてこの日ことをしみそして着通るのであるのだ、カタリナが三度、階下の歳のほんと云うのでは、………………」 幸子は「あの姉は大正上突と見合せて頼みそれにしなかったので、これから早くへ行って行くと、切られ出すの、その御二人のんちゃんで御さしますよ。姉さん達も気務不台所なあるから、一日所であって上ってから、きっとくこの迄物は如何にくの着いた時には子させも此処から幸い詰まって日本家とは、彼当に家族あれていたが、船場の事に通っていた陣場にぐけところも有難いたい皆やろか。分らそう云う、この人「早いやろ」にドを明かる物になる、あれ、どうしてものふっと云って、考えへこと置めて貰うとことだと云う感じが、幸子は一つ「体魔さん、早う

----------------------------------------------------------------------------------
(「細雪」原文の続き) 可愛がって内の子供をさっぱり可愛がってくれないと嫌味を云われたことがあって、返答に困ったのであるが、正直のところ、雪子はちょうど悦子ぐらいの年頃の、悦子のような型に属する女の児が好きなのであって、本家の子供達と云うのは、なるほど大勢いることはいるけれども、女の児は今年二つになる赤ん坊が一人だけで、あとは男の児ばかりであるから、彼女の関心を惹く程度は、とても悦子とは比べものにならないのであった。
----------------------------------------------------------------------------------




今回はLSTMに何も追加の工夫を施さず、またIteration回数が少ないので完璧な推論は望めませんでしたが、AIが谷崎潤一郎の文体や当時の言葉遣いをうまく踏襲しているのがみてとれるのではないでしょうか。
以上でLSTMを用いた文章推論の一例を示してみました。Deep Learning 技術やAI技術はちょっとした工夫で面白いサービスを生み出すことができます。特に大企業でAI活用命令が出されて困っていらっしゃる担当者様、活用してみたいが技術のわかる社員がいない企業様、是非POYNTER技術顧問サービスに相談してみてください(弊社POYNTERと直接契約ですと費用が割安です)。

お問合せ

© 2018 POYNTER All Rights Reserved | POYNTER