用語
協調フィルタリング
ユーザまたはアイテムの素性を利用せず、ユーザのアイテムに対する過去のレイティングに基づいて予測を行う手法。
推薦システム: 統計的機械学習の理論と実践
内容ベースフィルタリング(content-based filtering)と横並びになる概念。
推薦システムのアルゴリズム
Candidate Generation Overview
クエリ(コンテキスト)
システムが推薦を行うために使用する情報。
- ユーザ情報(ID、ユーザが以前に操作したアイテムなど)
- 追加のコンテキスト(時刻、ユーザーのデバイスなど)
セレンディピティ
目新しさに,思いがけなさ,予見のできなさ,または意外性の要素が加わった概念。
推薦システムのアルゴリズム
多様性
推薦リストに含まれるアイテムが互いに似ていないこと。セレンディピティを定量化する試みの一つ。
推薦システムのアルゴリズム
内容ベースフィルタリング(content-based filtering)
検索対象の内容を考慮して推薦する。
推薦システムのアルゴリズム
あるユーザへの推薦にあたり、他のユーザに関するデータが必要ない。
Content-based Filtering Advantages & Disadvantages
ランク学習 (learning to rank)
クエリが与えられたら文書のランクを予測し、そのランクに従って並べ替えることで結果リストを組み立てることができる。このような問題を学習することをランク学習という。
AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル、ベストプラクティス、アーキテクチャ
folding
https://developers.google.com/machine-learning/recommendation/dnn/training
Folding: Why Good Models Sometimes Make Spurious Recommendations
Position-based Model(PBM)
C(クリックデータ), O(アイテムがユーザに見られているか否か), R(真の嗜好情報)という3つの確率変数を用いてポジションバイアスの影響を表現するモデル。ポジションバイアスの推定にはいくつかの手法があり、EMアルゴリズムベースの手法であるRegression-EMは、ログデータのみから推定が可能。
施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方
ライブラリ
Implicit
暗黙的フィードバックのデータセット用のPythonによる協調フィルタリングのライブラリ
アーキテクチャ
レコメンデーションシステムの一般的なアーキテクチャの1つは、次のコンポーネントで構成される。
- candidate generation
- scoring
- re-ranking
Recommendation Systems Overview
参考書籍
推薦に関する和書は少なく、下記で買い揃うと思います。
推薦システム: 統計的機械学習の理論と実践
情報推薦システム入門 -理論と実践-
集合知プログラミング
AIアルゴリズムマーケティング 自動化のための機械学習/経済モデル、ベストプラクティス、アーキテクチャ
施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方
記事情報
- 投稿日:2021年9月18日
- 最終更新日:2021年10月3日