過去在設計數位廣告系統時,為了將廣告最適化遞送到使用者面前,因此一套系統在商業考量的初期,必然也思考過能不能運用在其他的領域,像是將整個演算法視為一套「推薦機制」,針對使用者興趣及愛好來推薦對方想要的資訊、內容或是商品等。從中,我們認為在龐大的資訊世界裡,與其使用者篩選耗費許多時間,好的推薦機制應該可以令使用者為我們帶來更高的黏著性與貢獻度。 具體而言,從系統概念的設計角度來談,或許沒那麽精確,不過倒也能用來解釋推薦機制背後運作的邏輯或架構。

先從數位廣告的角度來舉例。過去,使用者到了A網站、B網站時,A與B網站上會有廣告版面,廣告機制負責填補廣告至A或B的網站上,使用者處在「進入了A或B網站,相對才看到廣告」的狀態。這時,如果談到精準行銷兩字,精準則是被設計在網站本身的內容屬性上,例如A網站是汽車網站、B網站是美妝網站,因此我是汽車商要下廣告時,我就會下在A網站,我是女性商品廠商,相對就會下載B網站。

透過網站內容本質去做分眾,靠的是「普遍認知與網站價值觀認定」,所以較少會看到在汽車網站上,出現母嬰用品的廣告。一般廣告主在預算有限的狀態下,也不大敢做出太大違背普遍認知的廣告投放策略。

另外一點,早期買賣數位廣告,賣的是時段、版位(尺寸)、創意等。簡單說,廣告主想買廣告就是投放N週早中晚哪個時段、在N個版位上出現、用N種方式呈現不同的廣告創意。所以,廣告主要付出的是「一包錢」,跟銷售業務討論過後最後折算出來的整包廣告費用。 此種做法行之有年,至今2017年還是有很多媒體網站靠這方式在賣廣告。

可能有的人會問,現在廣告主很聰明,都會要求買曝光、點擊,媒體怎麼可能還用這種老派方法賣廣告?背後牽扯原因很多,但大部份會堅持的理由不外乎是希望廣告價格不要被打爛,然後可以一次賣一大包出去,而不是去承諾多少量賣多少錢這種做法。沒有好或不好,站在買跟賣之間,看的是雙方對於價值觀認定,要討論廣告有效或沒效,市面上有無數選擇,端看彼此怎麼找到最多交集。

可是,大多廣告主會要求曝光數、點擊數,這沒做到還是很難在現今競爭激烈的市場生存吧?因此其一作法,有的媒體會靠延長廣告走期、增加廣告版位、放大廣告曝光頻率等,來想辦法迎合某些很重要不能夠流失的廣告主。其二作法,也是業界普遍為人詬病的地方,那就是做報表,在廣告主無法監控或技術監控上有一些難度時,靠著人工手動的方式,修改要給客戶的廣告報表。要是預期數字距離原先差距過大,則會再使用業務話術美化整個廣告成果。這麼做,事實上會破壞與廣告主之間的信任,但此類現象已是大家心照不宣不願打破的真相。

既然廣告主要求日趨越增,為何媒體不去因應提升技術服務品質?答案很簡單,不外乎「一套符合廣告主期待的數位廣告系統,研發成本之高,遠遠超過媒體所能預期獲得的利潤。」 研發成本到底有多高?幾百萬?起千萬?幾億?說實話,研發數位廣告系統是條不歸路。因為系統不僅決定廣告怎麼遞送,還有背後支持的數據運算系統,時時刻刻得進行各種計算。所以絕對不是幾百萬或幾千萬能做到。

錢還不算大事,最困難之處來自於人才,一位優秀相關技術人才薪資少說每月7萬至30萬不等,具體要看分工與專業程度。然後是硬體與頻寬等成本,更可怕的是時間成本,開發一套系統下來,要成熟到商轉具市場競爭力,沒耗費兩年以上有難度,而且拿一套模型去計算數據,很可能得用上數天,幾天過後才說數據不能用可常常發生。

回到主題上,還是談談推薦機制。

過去的數位廣告買法前面段落提過,不再多說,談談現在廣告主的買法。許多數位廣告從業人員,嘴巴裡最常談到的就是廣告可以做到精準、分眾,將廣告投送到對的人眼前,這句話背後代表什麼意思?精確的說,以前是先有A、B網站兩大標的,廣告主預設會進去A、B網站的人多少會符合該網站屬性。以此為前提的推論,可模糊定義出,或許能用此觀點看待使用者。但使用者不會只有一種興趣、嗜好,因為從我們自己的習慣來看,喜歡看A汽車網站的人,不代表不會去看B美妝網站,端看「每個使用者」的習性與興趣而有所差異,或是產生相對關聯。

從過去買「版位」,到現在買的是「到訪使用者」。到訪使用者怎麼買呢?或者更具體的說廣告主買到誰?這邊就要先提幾個簡單概念,當使用者到了某個網站的某個網頁裡,閱讀了某段內容,此時,我們可以歸納出:

1. 該網站是什麼「類型」的網站

2. 該網頁內容有哪些「文字」

3. 該網頁屬於網站裡的哪種「類別」

4. 閱讀(停留)時間有多長

5. 在該網頁上產生哪些行為

6. 同樣閱讀該網頁的人有多少

7. 閱讀後產生相似行為的人有多少

8. 使用者在站內閱讀相似類別與內容的數量多少

9. 使用者最常在哪些頁面離開

10. 使用者翻頁狀況到什麼程度

上述十點,不過只是簡單定義使用者的幾個方向,舉例來說,當使用者看到了某網頁後,系統要有能從該網頁將所有內容收集下來,並且做出自然語意分析的能力, 然後自動進行斷字、斷詞、斷句的功能,將一篇原先完整可以由使用者去閱讀的文章,變成系統可以定義出各種標籤的內容組成,把內容中不需要的連詞、贅詞等剔除,再來進行該內容組成中,被分割出來的關鍵字進行權重排序,分出一篇文章中眾多關鍵字的重要高低順序, 再一一的將該關鍵字貼在使用者身上,此時在系統端紀錄的會是「IP+關鍵字+各種不同的屬性標籤」等。

讀了一篇文章,對系統的認知就是「從一個陌生人,變成一個稍微好像知道是什麼樣的人。」接下來,只要該系統連結的網站、服務夠多,可以在不同類型屬性的網站上,追蹤到同一個人,那就可以透過不同內容來不斷定義使用者的輪廓,並區隔出不同的族群。這個過程,我們稱做標籤化(Tagging)。

不過事情沒有說起來那麼容易,因為使用者的行為在真實世界不一定連續,有可能他會換電腦、有可能他的IP一直在換、有可能他使用情境不停變更,這也是為什麼資料存太久、太多反而不一定會有用的問題。因為,我們無法限制使用者在有限變數下依照期待去完成每一個系統設計好的任務。 因此,使用者的輪廓資料要能夠「固定化」,那就要盡可能在「需要登入」的網站服務上,跟該網站的會員資料進行串接、驗證。

這點,就是Google與Facebook最強大優勢,因為幾乎每個人都會登入Google,不論是日曆、郵件、Chrome等,或是FB只能登入後使用,因此在辨識使用者上,有夠多資料能夠去固定住使用者基礎輪廓,再靠著這些資料將使用者於不同時間上網時所產生的IP對應到其使用的服務之中,使用者的興趣嗜好就不會因為模糊的去做標籤定義,而少掉定錨固定這道程序而發生過大的誤差。

了解使用者怎麼被定義之後,內容推薦又是怎麼來?或是怎麼推送給使用者認為最適合他們的廣告?我們從使用者被各種標籤定義過後的資料可以設計出幾套不同的運算模型,以下舉個具體的例子。使用者看了A網站,也看到了A-1廣告,此時點擊了A-1廣告。 從前面提到的,A網站屬性類別、內容所在類別、內容本體構成的各項關鍵字權重,模糊定義出使用者的興趣與嗜好,此時靠著這一點做推論,推論這類使用者是否對A-1廣告會有興趣,有興趣的話則再次於使用者本身貼上廣告相關屬性標籤,這跟閱讀時內容本身的標籤又不大一樣,其可被定義的標籤包含了:

1. 廣告主是誰?

2. 廣告商品是什麼?

3. 廣告商品屬於哪一種類型?

4. 廣告訴求是什麼?優惠?新品?活動?

5. 廣告內容有無限制?限時?限量?限定?

6. 廣告圖文構成比例?圖20%字80%?或相反?

7. 廣告圖像鮮豔程度?明亮飽和?黑白俐落?

8. 廣告點擊後停留時間?

9. 廣告點擊後跳出頁面?

10. 廣告相關文案有哪些?

看起來好像不過是10點(網站內容) VS 10點(廣告內容)的組合,但每一點背後的相關參數再加上去,交叉配對下來可能會產生出上千種、上萬種的組合,再加上使用者動態的行為變化,依照其變化給予不同的運算模型,其產生出來的組合可能高達數十萬種、數千萬種交集。這些交集,往往要在幾百毫秒以內,透過難以想像的高速計算,得出一個要投放或是不投放廣告的決策,以及不投放那要輪哪一個廣告、要投放則是要選擇哪一個比較符合廣告主的預期效益,以及使用者本身會否產生行為的可能性較高。

總而言之,經過龐大的計算過後,使用者因為點了A-1廣告,系統會先假定使用者對A-1有興趣。此時,系統再繼續測試,將A-2、A-3廣告投放給使用者看,測試使用者是不是一如先前觀察到的結果。假設,使用者都對A-2、A-3廣告產生興趣,那這時會將該使用者歸類到某個群體(Grouping)之中,該群體會先被貼上「對A-1、A-2、A-3廣告產生興趣的使用者」標籤。

可是,使用者行為無法預測,根本不可能控制,不是每個使用者都會對A-2、A-3廣告產生興趣,這又該怎麼看待?這也就是每個群體之間會不斷產生動態計算,不停移動使用者,在群體之間反覆去測試,並且加權計算,再去測試,反覆經歷大量的資料與內容交互因應行動的結果,來逼近某個預計原始模型的結果推論。

此時,系統中會有數十、數百萬個不同群體不停動態移動著使用者,每個群體都有自己的標籤以及對應內容的接觸成功率。所謂接觸成功率就是剛剛提到,我們會有些基礎推論,推出一套原始模型來看待使用者可能產生的行為,然後再從該套模型中去衍生出第二套、第三套,藉由深度學習,不停的運算,找出有交集之處、差異化之處,然後套用到模型之中,再歸納為群體,並成為現在我們操作Google、Facebook所看到的「廣告分眾系統」,看起來選擇這群人好像很簡單,背後運作起來有多困難,已經不是一篇文章能夠道盡。

有了分眾,就表示「我們知道哪些人(標籤過後),可能喜歡哪些內容(標籤與結構化過後),而且透過科學化運算(行為分析模型),將該內容提供給使用者,有相對多少%機率會獲得對方的喜好,而且又有多少%機率提供其他內容,使用者會有多少%機率不會討厭而離開,甚至有多少%機率會採取行動,點下喜歡或是讚。」這句話,就是推薦機制最簡單的解釋,想要講出這句話,沒有前面的理解,可能要懂也很難,因為一套推薦機制要衡量的不是單向資料,而是多向、多面相的內容,這些看似陌生的資料能不能有交集,其背後蘊藏的不只是科學,還有更多難以想像的哲學。

(Visited 1 times, 1 visits today)

發佈留言

關閉選單