阿里妈妈直通车新一代智能检索模型
传统搜索广告召回
为了兼顾效果和性能,一般分为QR(Rewriting)和检索(Ad-selecting)两部分。
QR主要考虑query和bidword的文本相关性,目标并非优化RPM/CTR。
索引依赖bidword。但受限于市场信息的缺失和投放管理的成本,广告主有时并不能及时准确地为自己的广告选择出最合适的bidword。
检索出于性能考虑,使用简单规则而不会用复杂的模型。比如BS。
传统搜索广告召回仅由query触发,并未考虑用户画像,长期、实时点击偏好等信息。这些个性化signal其实也有助于更好的理解user intention。
相关工作
QR
解决query过短问题:伪反馈,外部资源,landing page
利用session数据,利用点击二部图(simrank++)
MT、SMT、NMT
伪相关反馈,参考《信息检索导论》第九章。
检索
WAND
各种索引技巧
智能检索模型
3232 3种node、2种edge、3种init、2份index
3种node:
signal Query、用
...