前回のコラムでは、従来アンケートに頼っていた心理的安全性を、Slackのメッセージのやり取りから推定する研究例を紹介しました。今回も引き続き、オンラインチャットツールのやり取りのデータからワークエンゲージメントレベル(WEL)を推定する研究を紹介します。
出典
Hiroaki Tanaka, Wataru Yamada, Keiichi Ochiai, Shoko Wakamiya and Eiji Aramaki : Estimating work engagement from online chat tools
https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-024-00496-9
会話の「内容」ではなく「つながり」に注目する発想
今回紹介する研究は、Slackのやり取りから、社員のWELを推定する試みです。ポイントは、 メッセージの「内容」ではなく「つながりの構造」 に注目していること。
つまり会話内容へのアクセス無しでチャットプラットフォームの「構造情報」(=誰と誰がどれぐらい話したか)からWELを推定します。
この提案の根幹は次のような既存の研究に着想を得ています。それは人の行動や性格はソーシャルネットワークに影響され、さらに感情がネットワーク内で伝播する、というものです。例えばポジティブな投稿が減るとネットワーク全体で明るい投稿が減るように、気分も伝播します。これら既存研究は、各人のWELが対人関係からも影響を受けるという仮説を支持しています。よって、テキスト情報にアクセスしなくても、職場内のネットワーク構造(誰が誰とどのくらいやりとりしているか)を捉えることでWELを推定できると考えられます。
研究デザイン
研究では3つの異なる組織(Org1〜Org3)で、Slackのメッセージログと定期的に実施されたWEL調査データを対応づけています。収集期間は組織ごとに異なり、Org1では7か月以上、Org2は4か月、Org3は2か月です。
解析の流れは次の通りです。
- Slackのメッセージから「誰が誰にメッセージを送ったか」を抽出し、重み付きネットワークを構築。
- 各ユーザーごとにアンケート由来のWELスコアを付与。
- ネットワーク構造や言語的特徴を基に、WELを推定できるかを検証。
このデザインにより、ネットワーク構造 vs 言語内容 のどちらがWEL予測に有効か、また期間の長さが予測性能にどう影響するか、を比較できるようになっています。
ネットワーク構造 vs 言語内容 の比較 (事前分析)
まずは事前分析として、著者は 「語彙や会話の中身よりも、ネットワークの構造のほうがWELを反映するのではないか」 という仮説を検証します。ここでは以下のようにシンプルな手順で検証しています。
1. Slackのやり取りから個々のユーザーについて次の二つの特徴量を計算。
- ネットワーク構造の特徴量:Slackでやり取りした相手のWELスコアを4階級で表し、それぞれの階級の頻度を特徴量とする。
- 言語内容の特徴量:Sentence-BERTでSlackのメッセージを埋め込んでユーザー平均をとったもの。 (Sentence-BERTは会話本文をベクトル化し「何を話しているか」という内容を特徴量に変換する。「会話の中身」から WELを推定するアプローチといえる)
2. ユーザー同士でペアを作り「特徴量の類似度」と「WELの差」を計算。これを全ペアについて実施する。
3. 全ペアの「特徴量の類似度」と「WELの差」から相関を算出。
分析の結果、Org1 の例ではグラフ構造による相関係数は -0.43となり明確な負の相関を示しました。これは特徴の類似度が下がるほどWELの差が開く、つまり特徴が似ていればWELも近くなることを表しています。一方で言語特徴は0.06 にとどまりました。
ここから「話す内容が似ている」ことより「話す相手が似ている」のほうが、よりWELも近い、という結論が得られます。直感的には、エンゲージメントはチーム内の影響(contagion)で伝播するため、接点のパターンこそが本質を映すのだ、というわけです。
GNNによる分析
続いて、事前分析で得られた洞察を踏まえて 「手作業で抽出した特徴ではなく、表現学習で個人表現を作ればもっと精度がよくなるはず」 と進みます。ここで登場するのが グラフニューラルネットワーク(GNN)です。
通常のニューラルネットワーク(NN)は、画像ならピクセルの並び、文章なら単語列といった規則的なデータを入力にします。しかしSlackのようなチャットのやり取りは、「誰が誰にメッセージを送ったか」という関係で表現され、これは行列よりもグラフ構造(ネットワーク)に近いものです。社員のやり取りをネットワークで表現すると、個々の社員をノード(点)、社員間のやり取りをエッジ(辺)で表現ができます。さらにやり取りの頻度を埋め込みデータで表されます。つまり、GNNにおける「ネットワーク」とは、人と人の関係性の網の目を指しています。
GNNは、このグラフ構造を直接扱える点に特徴があります。各ノード(社員)は自分自身の特徴だけでなく、隣接ノード(よく話す相手)の情報を取り込みながら表現を更新し、層を重ねるごとに「自分+周囲+さらにその周囲…」という多層的な関係を埋め込みに反映させていきます。これにより、単純な度数中心性や接触頻度よりも柔軟に「ネットワークの中での立ち位置」を表現できます。
この点が、NNとの大きな違いです。
共通点:学習は通常のNNと同じく、入力→隠れ層→出力という構造を持ち、誤差逆伝播で重みを調整します。
相違点:NNは規則的な配列データに強いのに対し、GNNは「不規則なつながり」を前提とし、隣接関係から特徴を集約する仕組みを持っています。
本研究では、代表的なグラフニューラルネットワーク(GNN)の手法として DeepWalk および Deep Graph Infomax(DGI)を使いました。DeepWalkは古典的な方法で、社員同士の会話を「ネットワーク」として捉え、その上をランダムに歩き回るように経路を生成し学習します。すると「誰とよく話すか」「どのグループにつながっているか」といった関係性が数値ベクトルとして表現されます。一方のDGIは各社員の局所的な関係(近くのつながり)と、組織全体の構造(ネットワーク全体の雰囲気)を同時に学習します。また比較対象としてSentence-BERTで言語特徴についても学習しました。
これらで得られたモデルでワーク・エンゲージメント(WEL)を予測しました。
その結果、以下のような傾向が得られました。
Org1・Org2(データ量が多い組織)
ネットワーク構造に基づく手法(DeepWalk,DGI)が優勢でいずれも高い相関を示しました。特に DeepWalk は他の手法より高く、0.6(Org1)、0.54(Org2) という結果でした。一方、言語情報だけに基づく Sentence-BERT は、Org1で0.33、Org2でわずか0.12にとどました。
Org3(ユーザー数が少なく、データ収集期間も2か月と短い組織)
逆に言語特徴の方がやや優勢でした(Sentence-BERT 0.14、DeepWalk −0.02)。
以上から、Org1・Org2 のように長期でデータ量が多い場合は、ネットワーク構造による表現学習で高い予測精度が得られることがわかりました。
議論とまとめ
分析結果から導かれる最大のポイントは、「ネットワーク構造がWELの予測に強く寄与する」という事実です。Org1・Org2では、グラフ埋め込みによる予測が0.5〜0.6程度の相関を達成し、言語特徴を大きく上回りました。これは、エンゲージメントは言葉の内容よりも関係性のパターンに表れることを示しています。
ただし、Org3のようにデータ期間が短い場合には予測力が落ちることも確認されました。実務的には「十分な期間のコミュニケーションログがあって初めて、ネットワークベースのモデルは有効に機能する」といえます。
また、似たネットワークを持つ社員でもWELが異なる事例も見つかっており、ネットワークだけですべてを説明できるわけではありません。したがって、将来的にはネットワーク+言語+行動パターンの統合モデルが望ましいでしょう。
倫理的側面も重要です。チャットログを使った分析は「監視」と捉えられるリスクをはらみます。研究としては「個人を特定せずにチーム全体の傾向を可視化する」といった配慮が求められます。
総じて、本論文は「オンラインコミュニケーションの痕跡から、組織の心理的状態を読み解く」という挑戦的な試みであり、データ分析の新しい応用領域を示したといえるでしょう。ネットワーク分析やGNNを活用することで、従業員の幸福度やエンゲージメントをより継続的かつ低コストに把握できる未来像を描いています。
おわりに
リモートワークの普及により、私たちは「雑談から察する」時代から「データで気づく」時代に移りつつあります。2回に渡ってオンラインのチャットデータからワークエンゲージメントレベルを推定する試みを紹介し、自動推定の可能性を示しました。一方で「どう使うか」も問われています。もし適切に活用できれば、アンケートに頼らず、コミュニケーションのデータから組織の活力を把握できるようになります。そしてそれは、孤立しがちな社員への支援や、チームのバランス改善といった前向きなアクションにつながるでしょう。
職場のつながり作りを支援するサービスはこちら↓