两个模型都是用来预测CTR点击率的
点击率是0-1的
在一定程度上都是在时间序列数据基础上进行建模
DIN
在建模中引入了attention机制,然后引入了小批量自适应正则化和Dice激活函数
原本的base模型是将用户商品序列扔给池化层,得到一个序列建模向量(平均池化)
DIN是将商品序列与候选商品进行注意力计算,然后得到一组权重,权重与商品序列扔给池化层(因为有权重所以是非平均池化),得到一个序列建模向量
自适应正则化:原本的正则化是对所有权重平等的正则化,然后DIN中是对出现频率高的特征给予较低的惩罚
DIEN
DIN其实更关注的是用户序列和候选商品的相关性,并没有怎么考虑动态时序性
分为了两层,第一层将用户序列通过GRU,得到一个隐状态序列
第二层将隐状态序列与候选商品做注意力计算,得到一组权重,然后将权重和隐状态序列传给AUGRU(改进后的GRU模型),取AUGRU最后一步的隐状态作为序列建模向量
AUGRU:更新门会涉及权重调整
除了总的目标损失函数以外,还引入了一个辅助损失函数,帮助第一层的GRU更好的学习到用户的兴趣演变过程(使用下一个行为来监督当前隐藏状态的学习)