今回は、シンガポール拠点でAIによる画像解析を行っているQUILT.AI社の協力を得て、日本、中国、タイそれぞれでSNS上に投稿された人物写真の違いを分析しました。非言語的な表現である写真だからこそ、言語の異なる国・地域同士をフラットに比較することが可能になります。
分析結果を、生活総研の奥田さら研究員と、共同で分析にあたったメディア環境学者の久保友香さんが2回に分けて解説します。
生活総研の奥田さらです。多国間での定量調査結果を比較する場合、常に問題になるのは言語の違いです。近しい意味を持つ言葉であっても、微妙なニュアンスが異なる場合も多いため、完全に同じ基準で比較をすることは非常に困難です。
一方で、SNSなどデジタル空間上のプラットフォームは国を越えて普及しているため、そこに蓄積されたデータは国を越えて比較が可能です。今回はその中でも、生活者が自ら発信した非言語的な情報である写真、特にセルフィーなど人物が写っている写真に注目しました。
人物写真には被写体の表情や着ているもの、背景、人数や性別など、一枚一枚に多くの情報が含まれています。また、言葉の壁を越えて各国を一律の基準で比較することが可能になります。そして、SNSから取得した膨大な画像データの中から人物が写っている写真を抽出し、その中の情報を読み解く際の強力なツールとなるのが画像解析AIです。
具体的にはシンガポール拠点で画像解析AIを活用したリサーチを行っているQUILT.AI社の協力の下、2019年6月~2020年3月にInstagramおよび微博(ウェイボー)上に投稿された、日本、中国、タイで撮られた写真約20万枚の中から10代もしくは20代であるとAIが判別した約2.4万人(日本6,926人、中国7,338人、タイ9,244人)の顔を分析しました。
その結果、各国のSNSにおける人物写真には、顔の写し方や表情、そしてファッションや背景を含めた配色などの点で傾向の違いが浮かび上がりました。
今回はメディア環境学者の久保友香さんから、主に顔の写し方や表情という観点から、次回の記事では私から、セルフィーの配色という観点からの分析をご紹介します。
1.バーチャル・ビジュアル・アイデンティティの文化比較
メディア環境学者の久保友香です。
生活者がネット上で見せる写真や映像によって形成される、その人の視覚的な印象を私は「バーチャル・ビジュアル・アイデンティティ」(以下、「VVI」)と呼んでいます。コロナ禍によって、実際に対面するリアル・コミュニケーションから、ネットを介したバーチャル・コミュニケーションへのシフトが急速に進んでいます。今、世界中の多くの生活者が、バーチャル・コミュニケーションにおける自分、VVIをどう築くかという、新たな課題に向き合っているのではないでしょうか。
では、そもそも人々はどのようにVVIを作っているのでしょうか?各国の文化差はあるのでしょうか?今回、博報堂生活総研が行ったビッグデータ解析の結果が、その答えを示すはずです。日本、中国、タイからSNSに投稿されたジオタグ付きの写真を、いくつかの観点でプログラムが自動判別し、各国の傾向を数値化しています。今回はその中で、3カ国の傾向の差が顕著となった、2つの観点に焦点を当てます。
そこに私がこれまで行ってきた日本の女の子たちのエスノグラフィで得た知見などを組み合わせることで、SNSに投稿された写真の裏側にある3か国の生活者の意識を探るというのが今回のアプローチです。
2.SNSでなぜ顔を隠すのか?
2-1 SNSで顔を隠す人の割合
3カ国で差が出た1つ目の観点は顔を隠す人の割合です。各国の写真に含まれている人の顔のうち、「顔の一部が隠れている」と画像解析AIに判定された割合を見ると、日本39%、中国37%、タイ28%という結果となりました。日本と中国では、タイよりも多くの割合を占めています。顔が写っているにもかかわらず、その「顔の一部が隠れている」写真の裏側には、生活者のどのような意識があるのでしょうか?
「顔の一部が隠れている」と分類された写真を具体的に見ると、「鏡越し」に自分を撮影し、撮影しているカメラで顔が隠れている写真や、「横向き」の写真などがありました。それらをよく見ると、日本と中国の写真の多くに共通する特徴が浮かび上がりました。それは鑑賞者の目を引く、顔以外のものがあるということです。例えば、ファッション、インテリア、ロケーション、それらの組み合わせで作られるシーン全体、あるいは、体型の良さ、鍛えた筋肉など。そこからは投稿者の「顔以外のものを見せたい」という意識がうかがえます。一方、タイの写真の多くでは、顔以外に、鑑賞者の目を引くものが見つかりませんでした。
2-2 顔よりも見せたいもの
中国と日本の写真で「顔以外のものを見せる」背景には何があるのでしょうか?以前、日本の大学1年生の女の子の行動観察をしていたところ、彼女は自身のインスタグラムのページを見せてくれつつ、次のように答えました。「顔写真を投稿したら保存数が3件しかなかったのに、安くてかわいい洋服屋さんの写真を投稿したら保存数が300件以上もありました。当然です。私の顔なんて誰の役にも立ちません。」日本の女の子たちはこの、インスタグラムの保存数という値を気にしています。別の高校1年生の女の子は「いいねの数はお友達の社交辞令の数だけれど、保存数は誰かの参考になったことを示す数だから」と言いました。つまり彼女たちは、SNSで、他者にとって有用なものを見せることを意識しています。
このことは、ビッグデータ解析の結果にも表れています。「顔の一部が隠れている」と分類された日本の写真で、鑑賞者の目を引く、ファッション、インテリア、ロケーションなどは、それを参考に、誰でも購入したり、出向いたりできるものです。一方、顔というのは多様性があり、簡単には真似できないものです。SNSに投稿する写真で日本の人が「顔以外のものを見せる」背景には、「他者にとって有用なものを見せたい」という意識があると考えられます。
一方、中国の人はどうでしょうか。中国での生活者研究を行っている博報堂生活綜研(上海)に取材を試みました。中国人研究員の余科さん、魏思瑶さん、張博睿さんによると、SNSに投稿する写真の最近の中国のトレンドとして、スポーツジムやヨガ教室での自分の体型、オフィスで仕事をする姿や、こだわりのファッションアイテムを身に付けた体の一部など、「自分が自信のあるもの」を撮影した写真の投稿があるということでした。確かに、ビッグデータ解析の結果でも、「顔の一部が隠れている」と分類された中の、「鏡越し」の写真では、中国では日本より、自分の体型を撮影した写真が多く見られました。
その人にとって自信のあるものが、顔であるとは限りません。顔は先天的な性質が表れやすいのに対し、体型や職業やファッションは後天的な努力で作り上げることができます。SNSに投稿する写真で、中国の人が「顔以外のものを見せる」背景には、努力で手に入れることのできる「自分の自信のあるものを見せたい」という意識があると考えられます。
ところで、タイの写真の中にも「顔の一部が隠れている」と分類された顔は28%あったわけですが、その背景には何があるのでしょうか。博報堂生活総研アセアンの研究員である伊藤祐子さんと高田知花さんに取材したところ、「タイの人は意識して顔を隠すことは少ないだろう」とのことでした。ただ、タイの人は写真を撮る時に「ポーズを決めることが多い」そうです。顔を隠す目的ではなく、ポーズを決める目的で横を向くなどしたものが、プログラム上、「顔の一部が隠れている」と分類されていると考えられます。
2-3 顔以外で作る人格
最後に一つ疑問が残ります。日本と中国の生活者がSNSに投稿する写真の中で「顔以外を見せたい」からといって、必ずしも「顔を隠す」必要はないのではないかということです。しかし哲学者の和辻哲郎が『面とペルソナ』で次のようなことを言っています。顔を知っている相手は、「顔なしにその人を思い浮かべることは決してできるものでない」とし、顔を知らない相手は、言語や文字など周囲の情報をもとに「無意識的に相手の顔が想像せられている」。これをSNS上でのバーチャル・コミュニケーションに当てはめると、SNS上の写真で、一度でも顔を見せれば、その人のVVIはその「顔」になり、逆に顔を隠していれば、その人のVVIは「顔以外」の周囲の情報から想像されるものになるということです。つまり、VVIを、タイの人は「顔」で形成しようとし、中国と日本の人は「顔以外」で形成しようとしていると考えられます。具体的には、中国の人は「自分の自信のあるもの」で、日本の人は「他者にとって有用なもの」で、VVIを形成しようとする傾向があるのだと考えられます。
3.SNSでなぜ笑顔を見せないのか?
3-1 SNSで笑顔をする人の割合
3カ国で差が出た2つ目の観点は、笑顔の割合です。各国の写真の中の顔のうち、画像解析AIによる表情の判定で、笑顔とされた顔の割合が下のグラフです。画像解析AIが10代と20代に分類した結果では、日本では年代差が表れ、10代で18.9%、20代で27.0%となりました。一方で、中国は10代、20代共に17%台で同水準、タイも10代、20代共に30%弱となっています。
つまり、日本の10代と中国の10~20代は、日本の20代あるいはタイの10~20代に比べ、笑顔の写真をSNSに投稿しない傾向がある、ということになります。この結果の裏側には生活者のどのような意識があるのでしょうか?
「笑顔をしていない」と分類された顔を具体的に見ると、偶然うつり込んでいるものなど、意識して撮影されていないと考えられるものが、多く含まれていました。そこで、意識して撮影されたと考えられる顔に絞って見ていくと、日本の10代と中国の10~20代の「笑顔をしていない」顔の多くに共通する特徴が浮かび上がりました。それは「目を見開き、口をすぼめる」表情をしていることです。それは「笑顔」の特徴である「目を細め、口を開く」表情とは、ちょうど反対の方向に筋肉を動かした表情であり、「笑顔」が意識的であるのと同様、この表情も意識的であると考えられます。一方タイでは、この表情を見つけることができませんでした。
3-2 「笑顔」より「決め顔」
「目を見開き、口をすぼめる」表情の背景には何があるのでしょうか?日本の女の子たちがプリクラで撮影した写真にも、そのような表情が多くあります。以前、専門学校1年生の女の子のプリクラでの撮影を観察した時、彼女はその表情を「練習している」と言いました。さらに、「本番ではぎりぎりまで目をつぶり、シャッタータイミングの直前に顔を作る」と。なぜなら「途中で目が乾燥すると、練習通りの顔ができない可能性がある」からだそうです。
このように彼女は、写真で見せる表情において、再現性を重視しています。笑顔は「目を細め、口を開き」ますが、もし、最大に目を細め、最大に口を開けば、笑顔として適度な範囲を超えてしまいます。微妙な加減をする必要があるので、失敗することもある。再現性が低くなるのです。一方、「目を見開き、口をすぼめる」表情は、もし、最大に目を見開き、最大に口をすぼめたとしても、表情として適度な範囲に収まります。加減する必要がないので、再現性が高くなります。
このことは、日本の女の子たちが使う「決め顔」という言葉にも表れます。あらかじめ「決め(た)顔」をできるということは、再現性の高さを前提とします。TikTokの中で、2018年より多くの人が動画を投稿している「全力顔」というテーマがあります。この動画の冒頭では、「全力笑顔」と宣言して「笑顔」をし、「全力決め顔」と宣言して「決め顔」をするルールがあるのですが、ほとんどの人が、「笑顔」では「目を細め、口を開く」表情をし、「決め顔」では「目を見開き、口をすぼめる」表情をしています。つまり「目を見開き、口をすぼめる」表情は、「決め顔」の象徴であり、「笑顔」とは相対するものだとわかります。
3-3 顔は「ある」ものでなく「作る」もの
それではなぜ、国によってこのような差が生まれるのでしょうか?博報堂生活綜研(上海)および博報堂生活総研アセアンの皆さんに取材する中で、それと相関のある行動が明らかになりました。それはSNSに投稿する写真の顔を、アプリなど使って、デジタル加工するかどうかということです。中国では「世代を問わず、誰もがする」のに対し、タイでは「あまりしない」ということでした。日本では、「学生を卒業すると同時に、盛るのも卒業」というような考えがあり、大人になると、肌の色を少し良くするような加工をすることはあっても、形を変えるような加工はほとんどしなくなります。
つまり「決め顔」をする傾向は、デジタル加工する傾向と一致し、「笑顔」をする傾向は、デジタル加工しない傾向と一致するのです。再現性はテクノロジーの本質であり、デジタル加工も再現性が高いので、「決め顔」と相関があることは納得がいきます。デジタル加工と「決め顔」には共通して、顔を「人為的に作ろう」とする意識があると考えられます。一方、デジタル加工しないことや、「笑顔」には、顔を「自然のままであろう」とする意識があると考えられます。以上より、中国ではVVIを「人為的に作ろう」とする傾向が、タイではVVIを「自然のままであろう」とする傾向があり、日本ではVVIを「人為的に作る」文化が10代にのみ存在している、と考えられます。
4. VVIの歴史、そして未来
リアルに会ったことのない人からも、バーチャルに知られるVVIを持つのは、かつては芸能人などだけでしたが、1990年代以降のデジタル・テクノロジーの発展により、一般人にも広がりました。それを先導したのは、日本の女の子たちだと考えられます。1995年にプリクラが登場すると、デジタル印刷された16枚のシールを一緒に撮影した友人と分配し、1枚をプリ帳に貼って残りを別の友人と交換し、交換して得た友人のシールもプリ帳に貼ってさらに別の友人と見せ合ったので、一般の女の子たちの顔写真が会ったことのない人の目にも触れるようになりました。さらに2000年、一般向けのカメラ付携帯電話(以下、ガラケー)が世界で初めて日本で発売されると、女の子たちは「自撮り」を始め、ガラケーでアクセスするインターネット上のホームページやブログの上で見せ合うようになりました。
誰もがVVIを持つことが世界的に広がるのは、スマートフォン(以下、スマホ)登場以降になります。2013年8月に当時アメリカ大統領のオバマ氏の夫人が、同月にローマ法王が「自撮り」の顔写真をSNSに投稿すると、その年末にイギリスのオックスフォード辞典の「今年の言葉」で、英語で「自撮り」を意味する「セルフィー」が選ばれました。その時点ではVVIの文化に、各国の大きな差がなかったと考えられます。しかし今回、2020年の博報堂生活総研によるビッグデータ解析の結果は、中国・日本・タイ3国において、VVIの文化差があることを明らかにしました。なぜ文化差が生まれたのでしょうか?そこには、技術革新が影響していると考えます。
今回明らかになった文化差の一つ目は、VVIを「顔」で形成するか、「顔以外」で形成するかという違いでした。中国と日本では「顔以外」で形成するという結果が出ましたが、日本でも以前は「顔」で形成していました。変化の背景には、モバイル端末の技術革新があります。かつてガラケーや初期のスマホのカメラの性能は低く、高解像度の写真を撮影するには「顔」のような小さい対象が最適でした。しかしスマホのカメラの著しい進化により、広い範囲でも高解像度に撮影できるようになり、「顔以外」を写真に含めるようになりました。今後はさらに、機械学習を用いた動画処理技術が向上し、次世代通信規格5Gも開始し、動画の利用が容易になります。技術革新を積極的に取り入れる日本や中国では、今後は動画を用いて、ストーリー型のVVIを形成することもさかんになると考えられます。
今回明らかになった文化差の二つ目は、VVIを「自然のまま」の姿で表そうとするか、「人為的に作った」姿で表そうとするかという違いでした。かつてアナログ写真の時代は、特別な時に化粧や照明を駆使して「奇蹟の一枚」を目指すことはあっても、日常的には「自然のまま」の姿を撮影することしかできませんでした。しかしデジタル写真では、自由に「人為的に作る」ことができるようになりました。顔のデジタル加工は、日本のプリクラが先導的に取り入れ、今や中国ではスマホのカメラに標準搭載するほど発展しています。最近では、機械学習を用いて性別や年齢を変えられるFaceAppや、別人になれるFakeAppなども登場して話題になり、VVIを「人為的に作る」技術は進化の一途をたどっています。この技術革新を積極的に取り入れる傾向のある日本の10代や中国の10~20代は、今後VVIをどこまで人為的に作っていこうとするのでしょうか?各国に根付いた倫理観や宗教観との関係の中で、VVIの文化差はさらに明らかになっていくのかもしれません。
→後編に続きます。