2013年にGoogleの研究チームにより発表された自然言語処理技術の草分けの一つ、「Word2Vec」。大量のテキストデータを解析することで、「言葉のベクトル」を算出し、その数値に基づいて言葉の類似性を導き出してくれる技術です。現在では機械翻訳やチャットボットなどへの活用が多くなされていますが、博報堂研究開発局では本来の自然言語処理だけにとどまらず、「言葉」をキーにした発想支援用途での活用研究を進めています。
Word2Vecを活用したツール作りに取り組んでいる研究開発局の春名宏樹、田原將志と、そのツールを試用して大きな可能性を感じた生活総研の酒井研究員が対談します。
定性的な分析から、新しい発想を促すツール
酒井:
まず、そもそもWord2Vecを知らない方も多いと思います。どんなものだと考えれば良いでしょうか?実際に使ってみると本当に、すごく面白い技術なんですが。
田原:
Word2Vecを簡潔に説明すると、それぞれの単語が持つ意味やお互いの関係性を多次元空間上のベクトルとして定量的に表現するためのツールです。この技術を使うと、言葉同士の意味の類似度を計算したり、言葉間での意味の足し算・引き算が可能です。例えば、「パリ – フランス + 日本 = ? 」という数式の答えは「東京」になります。
春名:
かねてから研究開発局では定量的なデータ分析に加え、定性的な分析も必要だと考えていました。定性的な分析は人間の発想を助け、意思決定や新しい課題発見につながるからです。
僕らは2015年頃から「言葉から社会を洞察する」という考え方のもとで「KOTOBAOLOGY(ことばオロジー)」というプロジェクトを進めています。世の中に流通している言葉から社会の背景や変化、生活者の意識や無意識を洞察することで、未来についても洞察できるのではないか、と。
ただ、これはあくまで人力で言葉を拾い、洞察し、仮説をひねり出す作業ですから、量的な限界がある。そこでテクノロジーの力を借りて新しい展開をしたいと考えていたんです。
田原:
私は、画像解析や自然言語、購買データなどを機械学習で解析する手法を日々リサーチしており、Word2Vecも以前から注目していました。春名たちと相談する中で、この技術が使えるんじゃないかと。
春名:
これまでのWord2Vecの活用法はチャットボットや自動翻訳など、言葉の意味を解析してスムーズにやりとりすることに主眼が置かれていました。「雨が降っていますね」という言葉に「天気が悪いのですね」と返答するのは、チャットボットとしての正解なわけです。
ただ、僕たちが今やろうとしているのは、「雨が降っていますね」という言葉に「何か悪いことが起きそうですね」と言ってくれることです。つまり、機械の返答に人間が「えっ?」と疑問に思ったり、意表を突いたりするような問いかけがなされ、新しい発想を促せないだろうかという指針を持っています。
幸福な孤独とは、旅のようなもの?!
酒井:
ここからは、実際にWikipediaのテキストデータを学習させたWord2Vecを用いた解析を見ていきましょう。人々の集合知で作られたWikipediaから生まれた言語空間は、私達の問いにどんな返答をはじき出すんでしょうか。
私は今回、ネガティブな言葉をポジティブに転換する数式を作ってみたのですが、その計算結果が面白かったんです。
例えば、「孤独 – 不幸 + 幸福 = ?」という数式を作りました。不幸でない、幸福な孤独ってなんだろう、ということです。
そうしたら、「旅路」や「郷愁」という言葉が計算結果として出てきて驚きました。でも、確かに一人旅って幸福な孤独と言えるかもしれない。
酒井:
その他に、「老化 – 不幸 + 幸福 = ?」という数式も作ってみました。幸せな老いって何だろう?と思いまして。計算結果として出てきたのは「治癒力」です。
以前、Q&Aサイトに60代男女が投稿した恋の悩みを分析したことがあるんですけれど、そのときに女性の悩みのキーワードが「許す」だったんです。要は、夫の過去の過ちをどう許せばいいのかっていうので、すごく60代の女性が悩んでいて。
許すっていうのも、ある種、心理的な治癒力だったりもするじゃないですか。結構、長生きしてるとメンタル的にもフィジカル的にも治癒力が大事なのかなと。
春名:
確かに、言い得て妙。他にも「腸内フローラ」とか「賦活(活力を与えること)」とか、「遺伝子治療」とか、そっちのほうへ行ってしまう考え方もあるっていうことですね。
広告の現場においても、商品やブランドの価値をいかに変換するか、あるいは価値を見定めるかという仕事がありますね。例えば、「自動車 + 快適」という数式の計算結果では、「家作り」という言葉が出てきます。車の快適性は、家に必要な快適さと似ているのではないか、という解釈から新しい仮説が成り立つかもしれません。
あるいは「クルマ – 運転 + 楽しさ」という数式。自動運転になった後のクルマの楽しさってなんだろう、ということです。計算結果を見ると、「カタチ」や「コトバ」、「本当の自分」、「ありのまま」っていう非常に不思議な言葉が出てくる。
これは何なんだと。どれも人間に対して問いを突きつけるかのようです。
酒井:
まるでお告げのようですね。
春名:
さらに言葉にこだわって「クルマ」と「自動車」は違うのではないかと考え、Word2Vecにかけて比較してみる。すると、「クルマ」は「快適」、「名車」といった価値に紐づくワードが、一方の「自動車」は「四輪車」や「二輪車」といった、やはり「自動で動く車」としての言葉が並ぶんです。
春名:
おそらく機械である自動車に対して、生活を象徴する価値がクルマだと位置づけられる。そこで、あるメーカーが「自分たちは自動車ではなくクルマを作るのだ」と表明して、自社の立ち位置や物作りの考え方を確立していけるかもしれません。
つまり、社会の中で、言葉がどのような価値を持ち、どのような環境に置かれているのかを考えることで、人や社会や企業がそこに全く別のものを発想していけるという見方もできる。言葉から何かを考えることで、私たちの社会に対する考え方もまた変わっていく。
社会への問いから導き出されたのは、どれも歌のタイトルだった
酒井:
日本語は漢字、ひらがな、カタカナとそれぞれで表現されていますから、同じ言葉でも全く違う印象を持ちますね。その分析ができる意味でも、Word2Vecは日本語の分析に向いているのでしょう。
春名:
そうですね。言葉の形や意味にこだわって社会を見立て、新しい発想をしていこうというのは、まさに僕たちが考えていたKOTOBAOLOGY的な考えにも近いです。Word2Vecでの言葉の数式は、色々な算出パターンが可能です。これまでご紹介した計算結果は、数式をそのままシンプルに算出したものなのですが、逆に「計算結果から最も遠い、対極にある言葉」を算出する、なんてこともできるんです。例えば、「社会 – 愛 + 機械 」という数式。愛のない、機械だけの社会とは?ということですが、そのまま計算すると「産業社会」とか「労働市場」というような言葉が並びます。しかし、この計算結果と最も程遠い、対極にある言葉はなにか?を算出すると、以下のようなリストになります。ほぼ全てが歌のタイトルなんです。
田原:
すごい発見ですよね。
春名:
やはり「愛」と「歌」は非常に関係性が深いのではないかと。Word2Vecは「愛がなければ歌はできない」と言っているのではと考えてしまいました(笑)。ひょっとすると、歌の力は人間だけが持っている絶対に必要な力なのかもしれない……と、ちょっと崇高なことまで考えてみたりするわけです。
この発想をもつことで、「歌」を軸にして何らかの分析や研究をしたり、あるいはキャンペーン開発をしたりといったことも考えられるわけです。生活者に好きな歌を聞き、その理由を尋ねることで、どういった愛を求めているのかまで探っていけるかもしれません。その考え方は、博報堂に根付く常日頃から生活者を起点にしてアイディアを考え続ける文化によって連綿と引き継がれていることでもあります。
現代は正解がない時代とも言われますが、新しい発想を生み出すためには、やはりユニークな問いが必要です。ただ、その問いの発見がすごく難しい。それを一緒に考えたり、提供したりするのが、まさに僕らの仕事だとも思います。その一環として、Word2Vecが役立てばいいですね。
Word2Vecは「言葉の足し算やひき算」という従来にない入力を行いますが、その行為自体がユニークな問いを強要するんですよね、強制的に発想し、問いのキャッチボールがなされていく。面白い発想を生み出すためにも、その精度を上げていきたいです。
Word2Vecの結果からストーリーを導き出す
酒井:今後、Word2Vecはどのような発展があり得ると考えていますか?
田原:
Word2Vecは人間のように言葉の意味を完全に理解しているわけではなく、同じような文脈で使われる単語を教えてくれるツールです。そこには意味としてみると若干の「おかしさ」や「不完全さ」がありますが、そういったアルゴリズムの性質は理解しながらも、人間の発想を広げるような方向へ生かしていけないかを考えています。そのためには近すぎず・遠すぎず程よくズラすロジックの検討や使いやすいUIが必須ですから、要研究です。
Word2Vecの裏側では、人間では知覚できないような200次元という超高次元の空間に、単語がぽつぽつと存在するような感じなんです。そこから特定の次元のみにフォーカスし、人間が知覚できる2次元の平面として切り出してみると、視覚的に新たな示唆を与えるといったこともできるかもしれません。
酒井:
現状では、使い方としては、どういったものが想定できますか。
田原:
僕がWord2Vecで面白いと感じるのは、ピンポイントの単語を見るのではなく、10から20並ぶ結果を全て見た中で、そこからストーリーを考えるという手法です。単語の空間そのものを可視化することで、新しい発想が生まれやすくなるはずです。
そして、時代ごとの人たちの言葉の空間が表現できるとも思っています。Twitterのデータでも、年代ごとの言葉を学習させてみると、それに合わせた空間が見えてきますからね。
春名:
今後は一人で使うだけでなく、入力した計算式や自分の発想の共有できるようなコミュニティのような機能があってもいいのかなと思っています。その場が、ある種のブレインストーミングとしても働く期待が持てますから。
「集合無意識」を明らかにし、ポジティブな発想を生む
酒井:
言葉の意味や定義って、今の時代、どんどん多様になっていると思います。そんな中で、暗黙的な共通点や集合知が見えてくるのもWord2Vecの面白さだと僕は感じました。
春名:
僕はそれを「集合無意識」と呼んでいます。例えば、「幸せ」という状態は存在するが、個々人に聞いても内容までは出てこない。「幸せ」は無意識化にあり、社会全体で共有されているものだからです。それをいかに言葉として引っ張り上げるかが大事だと思います。
「幸せとは何か」という答えを探すのではなく、その問いを発見できることが重要。問いを重ねる中で、「それはたしかに幸せを表している」と気づくためのヒントですね。
酒井:
そういう意味では、Word2Vecを使っていて、最も楽しい瞬間は何ですか?
春名:
ハッとするような瞬間があることです。先ほどの歌のタイトルしかり、思っていた答えと全然違う結果が並ぶときも、そのひとつです。
「今年の新入社員はドローン型」みたいに喩えるニュースがありますよね。あれは年配からすると「若い人たちの考えがわからない」という前提があるわけですが(笑)、Word2Vecも新入社員みたいに考えたらいいんじゃないかと。
言葉が通じないようで、ハッとすることを時々言っては、僕らに新しい気付きをくれる。全く違う発想を持った人間が現れたような感覚で、Word2Vecとも付き合えれば、ポジティブな発想を積極的に浮かべようという気持ちになれるんです。
酒井:
そういう突飛なことを言うのも含めて、新人のような感じがすると(笑)。
春名:
あとは新しい考え方の数式を思いついたときです。数式をストーリー化する考え方もあって、そんな風に、使い方ならぬ「付き合い方」自体を考えるのが、実は本当の楽しさなのかもしれませんね。