百度网盟广告相关技术
[TOC]
视频:http://www.chuanke.com/v2889565-173289-848527.html
笔记:http://www.yittoo.com/blog/index.php/2016/05/13/large-scale-ml-ctr-prediction/
笔记:http://www.doesbetter.com/638/
广告系统流程
广告位展现
广告候选:初选,简单规则,触发
点击率预估:对初选集合进行预估,机器学习方法
竞价排序:auction机制
维度约简
离散到离散 hashing:10000x1000dim (q,u)vector -> 1000dim hash table (有collision)
离散到统计 statistics:10000x1000dim (q,u)vector -> historic ctr, historic impr
关键是减少信息的损失
分布式计算架构
数据并行:每台机器存储部分数据、所有参数,适合图像数据
模型并行:每台机器存储
...