潘晓彤,毕业于南开大学计算机专业,曾供职于 Yahoo Search 和 Microsoft STC,拥有超过 5 年机器学习研究和项目经验,对排序学习,凸优化,概率图模型,回归模型,深度学习,强化学习,迁移学习有深入的研究,擅长根据业务需求搭建大规模分布式预测系统,利用机器学习算法优化在线效果。现任 FreeWheel 主任研究员,负责研究组预测模型研发工作。
CTR 预估是广告系统与搜索引擎的经典问题,利用 CTR 估计实现更加准确地定向,是提升公司精准 targeting 的有效途径之一。FreeWheel 是一家主要服务于北美和欧洲客户的视频广告公司,为大型电视媒体和优质内容供应商提供企业级的视频广告解决方案,每天完成近 10 亿次视频广告投放,积累了大量的视频观看和广告投放数据。FreeWheel 广告订单的计费方式与效果广告的按照点击付费(CPC)不同,FreeWheel 将所以计费模式抽象为 X-event,将 CTR 预估问题转化为 XTR 问题,基于 Feature engineering,Regression analysis,distributed computing 等技术,实现了一个强大的 XTR 预测系统,用于优化在线广告投放策略。其中解决了一些机器学习顽疾,包括正负样本不均衡,离散特征连续化,特征正规化,模型筛选等问题。本次分享主要介绍构建 XTR 预测系统的技术细节与难点。