逐次推薦のための意図対照学習 (ICLRec)

1. 序論

逐次推薦は、ユーザーの履歴行動シーケンスに基づいて次のインタラクションを予測することを目的とする。深層学習モデルは最先端の性能を達成しているが、ユーザー行動を駆動する根本的な潜在意図（例：「釣り具を購入する」、「休暇の準備をする」）を見落とすことが多い。これらの意図は観測されないが、ユーザーの動機を理解し、特にデータが疎またはノイズが多いシナリオにおいて、推薦の精度とロバスト性を向上させるために重要である。

本論文は、潜在意図変数を逐次推薦モデルに導入する新しいパラダイムである意図対照学習 (ICL)を提案する。中核となる考え方は、ラベルなしシーケンスからユーザー意図分布を学習し、対照的自己教師あり学習を用いて逐次推薦モデルを最適化し、シーケンスのビューとそれに対応する意図を整合させることである。

2. 背景と関連研究

2.1 逐次推薦

GRU4Rec、SASRec、BERT4Recなどのモデルは時間的ダイナミクスを捉えるが、通常、行動をアイテムの直接的なシーケンスとしてモデル化し、高次の意図シグナルを見逃している。

2.2 意図モデリング

従来の意図を考慮したモデルは、明示的なサイド情報（例：クエリ、カテゴリ）に依存することが多い。ICLは、暗黙的な行動シーケンスから意図を直接学習することで革新をもたらす。

2.3 対照学習

コンピュータビジョン（例：SimCLR、MoCo）や自然言語処理での成功に触発され、対照学習は同じデータの異なる拡張ビュー間の一致を最大化する。ICLはこれを適応させ、行動シーケンスとその潜在意図を整合させる。

3. 手法: 意図対照学習 (ICL)

3.1 問題定式化

インタラクションシーケンス $S^u = [v_1^u, v_2^u, ..., v_t^u]$ を持つユーザー $u$ が与えられたとき、目標は次のアイテム $v_{t+1}^u$ を予測することである。ICLは、シーケンスを説明するための潜在意図変数 $z$ を導入する。

3.2 潜在意図変数

意図 $z$ は、シーケンスの根底にある動機を表すカテゴリ変数としてモデル化される。モデルは分布 $p(z | S^u)$ を学習する。

3.3 クラスタリングによる意図分布学習

ユーザーシーケンス表現はクラスタリングされ（例：K-means使用）、$K$個の潜在意図プロトタイプを発見する。各クラスタの中心は1つの意図を表す。

3.4 対照的自己教師あり学習

中核となる学習シグナルは対照損失から得られる。シーケンス $S$ に対して、2つの拡張ビュー ($S_i$, $S_j$) が作成される。モデルは、シーケンスの表現と、割り当てられた意図クラスタの表現を近づけ、他の意図から遠ざけるように学習される。正例ペア（シーケンス、その意図）に対する対照損失はInfoNCE損失に基づく：

$\mathcal{L}_{cont} = -\log \frac{\exp(\text{sim}(f(S), g(z)) / \tau)}{\sum_{z' \in \mathcal{Z}} \exp(\text{sim}(f(S), g(z')) / \tau)}$

ここで、$f$ はシーケンスエンコーダ、$g$ は意図埋め込み関数、$\text{sim}$ は類似度関数（例：コサイン類似度）、$\tau$ は温度パラメータである。

3.5 一般化EMフレームワークによる学習

学習は、一般化期待値最大化 (EM) フレームワーク内で2つのステップを交互に行う：

Eステップ (意図推論): 現在のモデルパラメータが与えられた下で、各シーケンスに対する潜在意図 $z$ の事後分布を推定する。
Mステップ (モデル更新): 標準的な次アイテム予測損失と対照損失 $\mathcal{L}_{cont}$ を含む期待対数尤度を最大化することで、逐次推薦モデルのパラメータを更新する。

この反復プロセスにより、意図の理解と推薦品質の両方が洗練される。

4. 実験と結果

4.1 データセットとベースライン

4つの実世界データセット（Beauty、Sports、Toys、Yelp）で実験を実施した。ベースラインには、最先端の逐次推薦モデル（SASRec、BERT4Rec）と自己教師あり手法（CL4SRec）が含まれた。

性能概要 (NDCG@10)

SASRec: 0.0452 (Beauty)
BERT4Rec: 0.0471 (Beauty)
CL4SRec: 0.0498 (Beauty)
ICL (提案手法): 0.0524 (Beauty)

ICLは全てのデータセットで一貫して全てのベースラインを上回った。

4.2 性能比較

ICLは、RecallおよびNDCG指標で有意な改善を達成した（例：Beautyデータセットで最良ベースラインに対してNDCG@10で+5.2%）。これは潜在意図モデリングの有効性を示している。

4.3 ロバスト性分析

重要な貢献は、ロバスト性の改善である。ICLは、データスパース性（短いシーケンス使用）下およびノイズのあるインタラクション（ランダムに挿入された無関係なアイテム）が存在する状況で、優れた性能を示した。意図レベルの対照学習は、個々のノイズアイテムに対して感度が低い安定化シグナルを提供する。

4.4 アブレーション研究

アブレーション研究により、両方のコンポーネントの必要性が確認された：(1) 対照損失を除去すると性能が大幅に低下し、(2) 学習された意図の代わりに固定/ランダムな意図を使用しても性能が損なわれた。これは、意図学習と対照的整合の共同設計を検証するものである。

5. 主要な洞察と分析

中核的洞察: 本論文の根本的なブレークスルーは、単なる別の対照学習の工夫ではなく、現代の深層逐次推薦モデルへの潜在変数モデリングの形式的な再導入である。SASRecのようなモデルは強力なシーケンス学習器であるが、本質的には「ブラックボックス」な自己回帰モデルである。ICLの優れた点は、モデルに離散的で解釈可能な潜在意図 $z$ を通じてシーケンスを説明することを強制し、ノイズを除去し、「何を」の背後にある「なぜ」を捉えるボトルネックを作り出すことにある。これは、VAEのような生成モデルにおける哲学的転換を想起させるが、推薦のために識別的に適用されている。

論理的流れ: 手法は優雅にシンプルである。1) シーケンスをクラスタリングして意図プロトタイプを得る（Eステップの代理）。2) これらのプロトタイプを対照損失のアンカーとして使用する。3) 対照損失は、シーケンスエンコーダがこれらの意味的アンカーと整合した表現を生成するように規律付けする。4) この整合は、次にクラスタと全体的な推薦目的を洗練する。これは、表現学習とクラスタリングの好循環であり、EMフレームワークによって安定化されている。古典的なアイデアが現代の対照学習によって強化されたものである。

長所と欠点: 主な長所は、実証的に示されたロバスト性である。意図レベルで学習することで、モデルはスパース性やノイズに対して脆くなくなる。これは、多くの過剰パラメータ化された深層推薦モデルの重大な欠点である。また、フレームワークは基盤となる逐次推薦アーキテクチャに依存しない。しかし、主要な欠点は静的な意図の仮定である。モデルはシーケンスごとに単一の潜在意図を仮定しているが、実際にはユーザーセッションは多面的である可能性がある（例：贈り物と自分のための商品を閲覧する）。クラスタリングステップはハイパーパラメータ（意図の数K）と初期化に対する潜在的な感度も導入しており、論文ではこれらを軽視している。強化学習や探索研究におけるより動的な意図分離アプローチと比較すると、これは比較的粗い粒度の解決策である。

実践的洞察: 実務家にとっての要点は明確である：深層学習モデルに解釈可能な構造を注入せよ。単に大きなトランスフォーマーをシーケンスに適用するだけでは不十分である。ICLパラダイムは推薦以外にも適応可能であり、ユーザーの軌跡を持つあらゆるタスク（例：UIナビゲーション、教育パスウェイ）が潜在意図対照学習の恩恵を受ける可能性がある。研究者にとっての次の即時のステップは、これを単一の静的意図から階層的または逐次的な意図へ進化させることである。セッション中にユーザーの意図がどのように進化するかをモデル化できるか？さらに、これを因果推論フレームワークと統合することで、意図駆動の行動と偶発的な行動を分離し、真に説明可能でロバストな逐次モデルに向けて前進できる。コードの公開は、再現と拡張にとって大きな利点である。

6. 技術詳細と数式定式化

全体の目的関数は、標準的な次アイテム予測損失（例：交差エントロピー）と対照的意図損失を組み合わせたものである：

$\mathcal{L} = \mathcal{L}_{pred} + \lambda \mathcal{L}_{cont}$

ここで、$\lambda$ は対照項の重みを制御する。予測損失 $\mathcal{L}_{pred}$ は：

$\mathcal{L}_{pred} = -\sum_{u} \log P(v_{t+1}^u | S_{1:t}^u, z^u)$

意図変数 $z$ はシーケンスエンコーダに統合される。例えば、トランスフォーマーベースのエンコーダでは、意図埋め込み $g(z)$ を特別な `[INTENT]` トークンとしてアイテムシーケンスの先頭に追加し、モデルが予測を生成する際に意図コンテキストに注意を向けられるようにすることができる。

7. 分析フレームワーク: 事例ケース

シナリオ: Eコマースプラットフォーム上のユーザーセッションを分析する。

ICLなし: モデルはユーザーAのシーケンス ["ハイキングブーツ", "水筒", "エナジーバー"] を見る。共起パターンに基づいて "バックパック" を予測する。

ICLあり:

意図クラスタリング: モデルは "アウトドア準備" の意図クラスタを学習している。ユーザーAのシーケンス表現はこのクラスタに割り当てられる。
対照学習: 学習中、["ハイキングブーツ", "水筒", "エナジーバー"] の表現は "アウトドア準備" 意図埋め込みに近づけられる。
強化された予測: 推論時、モデルは "アウトドア準備" 意図を認識し、"虫除けスプレー" や "コンパス" など、意図と強く関連しているが必ずしも正確な履歴シーケンスと関連していないアイテムも推薦できるようになる。これは、疎なデータに対するより良い汎化とロバスト性を示している。

8. 将来の応用と方向性

マルチドメインおよびクロスプラットフォーム推薦: 潜在意図（例："フィットネス"）はドメイン間（スポーツ用品、栄養アプリ、動画コンテンツ）で共有され、転移学習を可能にする可能性がある。
説明可能なAI (XAI): 意図ラベル付きで推薦を提供すること（"釣り旅行を計画しているようだから推薦します"）は、ユーザーの信頼と満足度を大幅に高める可能性がある。
対話型推薦システム: 意図は、自然言語対話とアイテム推薦の間の橋渡しとして機能し、対話エージェントの一貫性を向上させることができる。
動的意図モデリング: 時間的点過程や状態空間モデルを使用して、単一セッション内での意図遷移（例："調査"から"購入"へ）をモデル化するようにICLを拡張する。
大規模言語モデル (LLM) との統合: LLMを使用して学習された意図クラスタの豊富なテキスト記述を生成し、解釈可能性を向上させる、またはLLM埋め込みを使用して意図プロトタイプを初期化する。

9. 参考文献

Chen, Y., Liu, Z., Li, J., McAuley, J., & Xiong, C. (2022). Intent Contrastive Learning for Sequential Recommendation. Proceedings of the ACM Web Conference 2022 (WWW '22).
Kang, W. C., & McAuley, J. (2018). Self-attentive sequential recommendation. 2018 IEEE International Conference on Data Mining (ICDM).
Sun, F., Liu, J., Wu, J., Pei, C., Lin, X., Ou, W., & Jiang, P. (2019). BERT4Rec: Sequential recommendation with bidirectional encoder representations from transformer. Proceedings of the 28th ACM International Conference on Information and Knowledge Management.
Xie, X., Sun, F., Liu, Z., Wu, S., Gao, J., Zhang, J., ... & Cui, B. (2022). Contrastive learning for sequential recommendation. 2022 IEEE 38th International Conference on Data Engineering (ICDE).
Oord, A. v. d., Li, Y., & Vinyals, O. (2018). Representation learning with contrastive predictive coding. arXiv preprint arXiv:1807.03748.
Kingma, D. P., & Welling, M. (2013). Auto-encoding variational bayes. arXiv preprint arXiv:1312.6114.
Jannach, D., & Jugovac, M. (2019). Measuring the business value of recommender systems. ACM Transactions on Management Information Systems (TMIS), 10(4), 1-23.