【笔记】美团案例-旅游推荐系统的演进

云计算 waitig 590℃ 百度已收录 0评论

来源:https://tech.meituan.com/travel-recsys.html
@美团点评技术团队

(以下为阅读笔记,目的是便于之后能快速检索到相关内容。部分文字与图片可能直接来自原文,如有侵权请告知,谢谢)


1. 背景
旅游推荐系统面临的问题:
1)本异地需求差异大:旅游场景中30%的订单是异地请求
2)推荐形式多样:包括景点推荐、跟团游产品推荐、景酒套餐推荐等,同时一个景点也会有多种类型的门票
3)旅游产品存在季节性
4)需求个性化


2. 召回策略
推荐系统包括两部分,召回策略生成候选集,排序策略对候选集进行排序。召回策略总览如图:


2.1 历史行为强相关
取用户一个月内浏览、收藏但未下单的POI,越实时权重越高。
2.2 协同过滤
1)POI点数量远小于用户数量,且为了便于新用户的冷启动,因此采用基于物品的协同过滤
2)基于POI浏览行为的协同过滤:包括两部分,一部分是窗口期较长(1个月),每日离线更新,缺点是用户当天的浏览行为无法捕捉;另一部分是基于用户实时POI浏览行为的协同过滤
3)基于搜索行为的协同过滤:搜索是强意图行为,作为POI浏览行为协同过滤的补充
4)相似度改进:用户浏览行为有顺序。用户浏览了A、B、C三个景点,A和C的关系可能比A和B的关系弱;同时浏览A时推荐B合适,浏览B时推荐A不一定合适。因此采用改进的相似度计算,l表示i和j两个POI点的序列跨度,Nijl是出现次数,α是衰减系数
2.3 基于地理位置的推荐
1)基于物:用户地理位置周边POI点中最热销的topN
2)基于人:用户地理位置周边人群,他们最喜欢的topN POI
2.4 替补策略
1)区分本地与异地请求,计算不同用户群体购买的热销POI


3. 排序策略
3.1 策略:xgb做分类器,auc做效果评估。离线auc有提升,就上线AB测
3.2 特征:
1)上下文特征:
(1) hour_of_day:一天中的第几小时
(2) day_of_week:一周中的第几天
(3) city_id:城市id(id越小,开战越早,越可能是热门城市)
(4) distance:用户和POI的距离
(5) SCENE_LR:本地/异地用户
(6) IS_POI_LOCAL:POI是否在本城市
2)POI特征:
(1) POI7天点击率
(2) POI7天支付数据
(3) POI7天的评分数
(4) 景区星级
(5) POI本/异地销量(根据用户本异地请求)
3)User-POI特征
(1) 7天内是否浏览过该POI
(2) 最近一段时间内是否浏览过该POI
(3) 根据基于POI的协同过滤,计算出User和POI的语义相关性


4. 工具化
开发了Debug工具,输入城市、展位、UUID、经纬度等,返回POI、召回策略与得分等,方便PM和RD测试、定位追查case。




5. 其它
1)主题标签挖掘:为POI打标签,用户用这些标签进行筛选,如:附近热门、近郊周边、亲子同乐、夜场休闲、周末去哪 等。目前采用规则法定义标签,如“亲子游”:
(1) POI下游亲子票种
(2) Deal标题包含亲子
(3) POI下有成人票和儿童票
(4) 用户画像为“亲子”的用户最近一个月购买的POI


本文由【waitig】发表在等英博客
本文固定链接:【笔记】美团案例-旅游推荐系统的演进
欢迎关注本站官方公众号,每日都有干货分享!
等英博客官方公众号
点赞 (0)分享 (0)