付海军,毕业于兰州大学,十年软件及互联网行业开发经验。现就职于时趣互动,任技术总监,负责移动原生广告系统开发、优化和数据挖掘工作,主要着力于系统架构设计和优化,解决大流量高并发下的系统性能、可靠性和运维效率等方面的问题。时趣互动成立于 2011 年,是新一代的企业移动社交营销解决方案提供商,一直专注于移动数字营销领域,主要通过一整套包含了战略-软件-大数据-广告投放为一体的营销解决方案帮助客户实现数字营销的价值,进行移动互联网的转型。曾就职于阿里巴巴集团万网多年从事主机面板和云计算底层开发,之后加入亿玛在线从事互联网广告程序化购买相关的工作,负责 RTB 竞价投放系统和大数据平台,2015 年加入时趣互动。对于系统架构设计和技术团队建设有浓厚兴趣,关注高可用架构,高并发实时系统,海量数据处理,服务治理和容器技术。新手奶爸女儿奴。
广告是广告主通过媒体以尽可能低成本方式与用户达成接触的商业行为。每个在线的商家和品牌都有引流和促销的需求,每个媒体都会有变现的需求,而广告则是联系二者的手段,商家通过媒体触达受众人群,同时广告也是众多互联网公司的主要盈利模式和引流渠道。互联网广告系统涉及到高并发架构、数据挖掘、用户画像、反作弊、个性化推荐、数据建模与算法优化等众多技术领域,非常考验架构设计和工程实践能力。互联网广告系统具有并发高(每天数十亿、百亿级别请求)、时延要求严格(通常需要在几百毫秒内完成)、用户关注点和购物兴趣变化频繁(用户画像更新频繁)、广告投放上下文变化多样(广告候选检索计算量大),因此对于广告系统稳定性和可靠性要求极高, 任何一环出现问题都会带来巨大的经济损失。本专题将会邀请业界资深架构师,分享各自在广告系统实践中的经验。
微信广告自 2014 年上线以来,分别发布了公众号与朋友圈广告。微信广告系统承载了每天十亿级以上的访问量,紧密与微信平台生态相结合,同时利用了腾讯大数据体系进行效果优化。
本次分享,首先会给大家展示微信广告的整体系统架构,并介绍重要的功能模块和数据流程。其中会深入讲解广告投放时的播放节奏算法,看如何解决微信环境下的投放优化问题。
广告播放的节奏,最基本需求是考虑预算控制,而对 feeds 流中可沉淀的广告,相比传统会更加难以控制,这里我们会介绍相应的策略。在效果上,我们还需要结合整个微信的特色去建设。微信用户一天只有一次收到广告的机会,每个时机的活跃情况也不同,将广告的投放节奏与之相结合能获得十分优秀的效果。此外,微信朋友圈广告更重要的特性就是它是一个社交广告,那么如何将社交影响过程与广告投放相结合,也会深入讲解其中的实践。
eBay 是全球最大的电子商务公司之一,通过互联网提供 C2C 和 B2C 服务。广告推荐对于 eBay 的业务至关重要,本演讲主题是关于 eBay 在社交网络如 Facebook 上的广告,不仅可以帮助 eBay 向已有用户精准地推荐商品,而且可以给 eBay 带来新的用户。
eBay 有超过 4 亿的用户(其中超过 1.6 亿的活跃用户)和超过 10 亿商品。在 eBay 上每秒有几千次的商品浏览点击。
我们建立了一个针对社交网络的具有高容错性、一致性、高扩展性和跨数据中心的实时计算的广告平台,这个平台建立在开源 Hadoop、Spark、Kafka、Cassandra 等大数据项目之上,本演讲主题将介绍平台的系统架构以及对大规模数据的实时处理。我们根据用户的行为在社交网络上向用户推荐最合适的商品。所建立的广告平台是灵活的,可以让我们很容易地做 A/B 测试和尝试不同的推荐模型。 我们的系统被设计成没有单点故障,支持 rolling upgrade,我们对平台的每个部分加了监控和故障警告系统,如果有任何问题我们都很容易发现。 我们的广告平台系统在实际中是 7*24 小时全年几乎无故障运行的。
在这次主题中,我们还会介绍怎么优化广告平台和推荐模型来改进 CTR(广告点阅率)和 ROI(投资回报率)。
过去 5 年,随着大数据处理与广告技术进步,数字营销行业也在不断变化,品效合一,已成为数字营销行业的大热点。在过去两年中,随着移动流量爆炸,手游等行业的崛起,使广告主对于深度效果的追求相比历史上任何时候也要更直接。随之而来的便是各广告平台的流量类型种类越来越多,投放功能越来越丰富。 同时对于传统投放人员来讲,专业性要求也不断提升到新的高度。本次分享会总结基于传统投放模式中遇到的一些问题,以及介绍对应而来的基于深度效果反馈的新投放模式和系统。
做机器学习的同学在工作中都会遇到预测结果的置信度问题,具体表现是模型刻画能力和推广能力的矛盾,部分需要推广能力结果的冷启动等问题。服饰电商广告排序会遇到的一个必须要解决的问题,商品换季和上新,换季和上新的时候对模型而言会出现没有历史的新样本,并且在未来一段时间这些新样本会成为排序要面对主要客体,所有之前模型积累的历史都变得不再“有意义”,这个时候如何去处理让模型更稳定让过去积累的历史更有意义,并且同时让新品能最快的积累足够的置信度,蘑菇街积累了一些经验。
CTR 预估是广告系统与搜索引擎的经典问题,利用 CTR 估计实现更加准确地定向,是提升公司精准 targeting 的有效途径之一。FreeWheel 是一家主要服务于北美和欧洲客户的视频广告公司,为大型电视媒体和优质内容供应商提供企业级的视频广告解决方案,每天完成近 10 亿次视频广告投放,积累了大量的视频观看和广告投放数据。FreeWheel 广告订单的计费方式与效果广告的按照点击付费(CPC)不同,FreeWheel 将所以计费模式抽象为 X-event,将 CTR 预估问题转化为 XTR 问题,基于 Feature engineering,Regression analysis,distributed computing 等技术,实现了一个强大的 XTR 预测系统,用于优化在线广告投放策略。其中解决了一些机器学习顽疾,包括正负样本不均衡,离散特征连续化,特征正规化,模型筛选等问题。本次分享主要介绍构建 XTR 预测系统的技术细节与难点。