數位廣告,網路趨勢,告訴你最真實的體驗

資料探勘真的跟你想的不一樣

八月 31, 12 • 網路趨勢4 CommentsRead More »
本文為客座:作者為食夢黑貘, 創立 BBS 個人版與設計部落格觀察是他目前最為人所知的網路代表作, 最近做出網點站來去評鑑網站經營來讓大家了解 SEO 的價值, 本職是高有效性/高效能運算與資料探勘/語意網路的工程師兼技術顧問, 其中也包含幾家 SEO 公司的顧問。個人網站為:黑貘來說

很多趨勢大師都說未來的技術是決定在語意網路與資料探勘,雖然這兩種技術是兩回事,但有其共同點,更重要的是要解決的問題是一樣的。

但說真的,有多少人去了解資料探勘真正的意涵呢?他跟一般的統計因子分析的方法到底有甚麼不同呢?或者說該如去設計應用或實作出來呢?許多人還停留在一知半解與道聽途說的狀態,以及語意網路真的可以帶給我們生活模式的不一樣呢?在這邊來嘗試著作一些解答…

很多人聽到資料探勘,就會說天氣比較熱的話,冷飲賣得比較好就是種資料探勘的例子,當然說這件事是資料探勘很有問題,因為這樣的描述是一種因子分析,是一種條件判斷,就像是買過哈利波特的人,會買奇幻文學會比沒買哈利波特的人機率高,這邊的”買過哈利波特”就是一種條件。

雖然說有些人認為資料探勘,就是不再以個人的背景(Profile)資訊去判斷,例如年齡,性別,收入,學歷等等固定的因子來決定的差異,事實上真正的資料探勘不是因子分析也不是條件判定,而是在於物件(Object)之間的距離(Distance)或關係(Relationship)。

傳統的行銷學有兩種方法,一種是找到對象,而這對象用的就是背景資訊去篩選定義,只是這背景選項再多也是相當有限,即使把年齡級距分得再細,收入階級分得再多,地區切割的更密,怎樣還是有相同的人,雖然如何區分兩個背景資料相同的人,但事實上他們要的東西不一樣,在傳統行銷並不重要,因為真正的重點是把透過廣告去”加強”商品的型像,讓每一個人想要你的商品,這才是對的另一種切入點.

雖然說這種方式導致單向度的社會,但在資源的應用與實務上,本來就不可能用太多資源去做市場區隔,更何況當面對每一個人不同的須求,最簡單,花最少資源,賺越多的錢就是給你最暢銷的商品,若你不買單就想辦法說服你這是你要的商品,你是甚麼樣的人並不重要,而你買了之後發現這東西可能不是真正你想要的,你買下的是商品背後的”標價虛榮”,以及你以為獲得的情境,其實不然。

透過資料探勘可以做到的是超過傳統行銷學想像的,利用各種行為去計算出關係與距離,就可以知道人與人之間的關係,商品與商品之間的關係,這種方法進一步的還可以算出每一個人對每一個商品的購買機率,因此當你進入商場或網路商城,就可以知道你會買甚麼東西是做得到的。

但拉回來說,我們都知道一個好的店長對於回頭消費的顧客當他出現時,心理就會有個譜,他會買甚麼東西都瞭如指掌,這比任何資料探勘還要更準,只是這前提是要熟的客戶與小的商場,當商品變多,客戶變多就做不到了,目前而言,資料探勘能做到的事,事實上人都做得到,甚至更好,但一個好的店長是相當少見,甚至他也只能了解幾十到幾百個客戶就了不起了,此時資料探勘就會在這邊發揮效用。

一個好的資料探勘系統,是能夠計算相當大量的資料,這是以百萬到數十億等級以上的資料來計算的,且能夠在一定的時間(幾秒到幾分鐘)內幫助數十萬到數百萬或足夠多的用戶,讓他們透過這樣的資訊來幫助他們的決策,進一步的完成使用者的須求,達成提升業績的結果,而前面的”資料量”,”時間限制”,”使用者廣度”是資料探勘系統是否成功重要的要素。

而往往因為無法達到這樣的要求,或者是開發者本來就不知道這樣的演算法,而選擇用統計式或條件式(Rule-BasedorCondition-Base)來做出這樣的輔助決策系統,當然好壞的演算法做出來的準確度有差,甚至有時候須要為了整個企業智慧(BusinessIntelligence)做一段時間的調校才能夠準,所以有時不是做得好不好的問題,而是做得出來與否的問題。

不得不否認的,用條件式就以達到2~3成的準確率,若是列出10個有2~3個準確也就很夠了,因此就聽到Cubie的Tempo說,他們當時想利用DataMining 做朋友推薦,但因為沒有時間就先做條件式的,而效果已經足夠了,這句話代表他很了解資料探勘的好處與困難,也知道與一般條件篩選式與之間的差異。而資料探勘就是從統計因子分析的2~3成的準確率變成7~8成,雖然說效果多了2~5倍,但須要的時間,資源的成本就高很多,若這是只是個推薦朋友的話,或許用統計條件就夠了,若這個是在大型電子商務的商品推薦的話,這就是很重要的工具與決勝點了。

甚至可以這樣說,小型的商店靠人就可以成功了,中型的賣場靠傳統的行銷與分析就夠了,但當成交筆數是百萬等級的,就要靠資料探勘取勝了,因為一個好的資料探勘使用者輔助系統,不只可以算出未來的銷售狀況,立即改善TurnOverRate迴轉率,也可以提升立即滿足度,讓庫存降低與出貨率提高,這件事小商店靠店長算就夠了,但大型電子商務若沒有引進這樣的系統就或跟別家產生差距。

相對的若能夠依每一個登入的使用者推薦個人購買機率高的商品,而不是用無差異的廣告行銷,甚至把分眾打散成個人,把每一個人都當成一個獨立獨特的個體,而不是用統計的幾種模型去套用,此時不只讓商品找到對的人,也讓人找到對的商品,降低溝通成本以及錯誤購買率,提升消費者購物經驗,這才是資料探勘DataMining對未來行銷最大的影響。

圖片來源:Flickr kmoney56

The following two tabs change content below.
Circle 專欄作者- 歡迎各位投稿。 通過審核後,將會排版配圖發文! 投稿請進以下網址: http://www.circle.tw/about-circle 或洽本站各編輯

Facebook 留言

4 Responses to 資料探勘真的跟你想的不一樣

  1. Jonathan Lee says:

    其實這樣說法會造成否定DATA MINING的發現新觀點能力,通常我們會以為的觀點,有時用DM去找,會發現不是那麼一回事。如果你用Shannon的entropy來做IG(Information Gain),就會比較清楚這些東西背後真正的意義。

  2. 创意威客 says:

    文章真的很不错,拜读!

  3. 008影院 says:

    呵呵 行业不同 没办法。

  4. 德安芳 says:

    看不太懂博主的文章!太深奥了!

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *