甲乙小朋友的房子

甲乙小朋友很笨,但甲乙小朋友不会放弃

0%

搜索广告架构概述

是视频搜索广告的业务逻辑和技术分享的学习笔记。

关键词

广告主: - 创建广告方案capaign,和capaign下的多条ads。 - 每个capaign和ads有budget上限。 - 每个ads有key words

Impression(展示):有ML/SideBar/Bottom....

Workflow

Query Understand --> Select Ads (From Ads Store) --> Filter Ads --> Rank Ads --> Select Top K Ads --> Pricing --> Allocate Ads

Query Understand

主要步骤: - Query Clean: remove stop words like "a", "the" - Steming: "boy's toy car" --> "boy toy car" - Tokenize: hawaii hotel --> ['hawaii','hotel'] - Query rewrite : canon camera --> canon cameras, canon camera ,能match尽可能多的ads - Category: 树状结构。important feature in relevance and pclick model

Select Ads

主要步骤: - 根据ads key words 和 user query匹配,此时relevance就很重要。 - 比如用户搜"Nike running shoe",那么"adidas running shoe"就比"nike soccer shoe"更合适,因为用户应该更注重 跑鞋,而不是nike。这时候用relevance score来衡量。 - 最暴力的relevance score: 倒排索引+onehot score。 - Learning to rank: 用机器学习方法,计算query 和 docs的score. 比如生成click的 pair <query, ad>,然后再人工标注是不是好的pair。此时有了训练label, 再加上一些feature,就可以机器学习了。 - Relevance model features: counting feature based on impression/click, Term similarity feature(BM25/TFIDF)

Filter Ads & Rank Ads

  • 总之,先根据qualityScore删掉垃圾ads,然后根据rank score排序
  • qualityScore = 0.75 * relevance + 0.75 pclick, 只是ad的质量
  • rank score = qualityScore * bidPrice,考虑到了钱
  • pclick, 是 <query, ad, user> score。 offline & online,略。
  • 冷启动问题:ms利用yahoo买流量。

Slect Top K Ads

  • 如上步骤,根据rank score排序

Ads Pricing

  • 每个广告都会有个bid 出价 (bid理论上是auto bidding,不会高于max budget)
  • 第二竞价:参与竞争某个位置的广告按照rank score 排序,然后rank score 最高的广告胜出,但是它花的钱是rank score 第二位的bid

Allocate Ads (是放在ML还是SideBar)

  • 只看bid price。出价高的去mainline,出价低的去sidebar