首屆阿里巴巴大數據競賽在今年“雙十一”進入最后的激烈角逐。
柯國霖(左一)和他的部分參賽伙伴。
廈門日報訊(本組文/本報記者 佘崢)比賽對我最大的震撼是看到學術界和工業界的差別。在學術界,你可以編制出很完美的算法模型,但數據可能需要“跑”幾個星期甚至一個月,才能得出結果。
——提到讓自己獲得第一桶金的比賽,23歲的柯國霖很清醒。
廈大學生柯國霖和其他高校學生組成的一個六人團隊,用算法成功“逆襲”阿里巴巴工程師,獲得阿里巴巴大數據競賽的100萬元獎金,他們獲勝的原因是比后者更加準確地推斷今年“雙十一”顧客的喜好。
用大白話來說,在今年天貓“我的雙11”頁面中,部分推薦和展示的商品,就是根據這廈大研究生柯國霖和他的小伙伴的數據算法得出的,“雙十一”的真實成交也證明,他們推薦的商品被顧客購買的成交率,高于阿里巴巴工程師組成的算法團隊。
23歲的柯國霖本科就讀廈大軟件學院,目前是廈大軟件學院研二學生。他昨日接受本報采訪,證實了此消息。他透露,六人將平分100萬元。其他五名學生分別來自南京大學、中國科學院大學、北京航空航天大學、南京航空航天大學,都是就讀計算機或軟件工程的研究生,都是“90后”。
A臨時組成六人團隊
和專家對抗
23歲的柯國霖本科就讀廈大軟件學院,目前是廈大軟件學院研二學生。第一屆阿里巴巴大數據競賽始于今年3月份,14個國家和地區的7000多支團隊的1.5萬多名大學生報名參加,既有清華、北大的高材生,也有牛津大學、諾丁漢大學的洋學生。
參賽的國內外大學生一般組成團隊,第一季比賽淘汰了絕大多數隊伍,只留下10支隊伍參加第二季比賽,柯國霖是其中之一。
相比較第一季的20萬用戶數據,這回給的是5億用戶數據。在七支隊伍被淘汰后,三支隊伍進入最后的第三賽季。原本的計劃是,包括柯國霖在內的三支隊伍,要和阿里的工程師隊伍比賽,爭奪獎金為100萬元的第一名。
不過,大學生們當時仔細分析了形勢:他們要面對的阿里巴巴工程師團隊已經是行家里手,與其“自相殘殺”,倒不如化“敵”為友,三支隊伍合并,一致對外。這并沒有違反比賽規則,阿里巴巴同意了。
B他們的“雙十一”推薦
更受用戶歡迎
9月20日,在阿里巴巴登陸紐交所上市時,柯國霖和他的五位小伙伴也在杭州開始最后一個賽季的角斗,白天他們到阿里巴巴上班,晚上回到租住的簡陋旅館,和時不時鬧罷工的熱水器做“斗爭”。在這一賽季,他們獲得上百億用戶行為的數據。
柯國霖說,比賽比的其實是算法模型的建立,以此分析用戶在天貓上的行為習慣和品牌偏好,并預測他們下一步可能會購買的商品。
他舉例說,如果你經常瀏覽衣服,那么我們就會根據你瀏覽的周期在首頁推薦衣服以及褲子、皮帶、鞋子等搭配品,而如果你這次購買了手機,下一次我們就會推薦手機殼、電源等。
在大數據里,這些都可以形成算法模型。換句話說,這些大學生就好比“推薦專家”,判定用戶買什么東西可能性大,并根據可能性的大小依次在首頁推薦商品。
最后的比賽也是“真刀真槍”——雙方選出各10%用戶的“雙十一”的真實成交量,看看哪一方的推薦更靠譜。
結果在11月12日凌晨就誕生:大學生團隊開發的首頁的成交率比阿里巴巴工程師高出16.14%。
C忙了八個多月
賽后連睡十幾個小時
事后,阿里云計算機官方微博稱他們是“了不起的90后”——短短一個多月的時間,就憑借精準的算法成功逆襲了天貓的算法團隊。
不過,六個“90后”當時錯過結果揭曉的激動人心的時刻。柯國霖說,太累了,我們都回去睡覺了。他們一直睡了十幾個小時,以至于過了一天才獲知自己“逆襲”了阿里巴巴工程師。
頒獎儀式在上周舉行,柯國霖沒有見到馬云,據說“馬總太忙了”。學生們從阿里巴巴集團CTO王堅手上接過了一張一百萬元的支付寶支票。根據事先約定,六人將平分這100萬元,扣除稅收,每人大約能得13萬元。
不過,這筆錢現在還沒到手。和他的伙伴一樣,柯國霖也不認為這值得大驚小怪——從三月份起,他們當了八個多月的技術宅男,酷愛騎行的柯國霖幾乎停止一切運動,因此胖了十斤。
這位晉江人最近根本沒有時間考慮如何處置自己的第一桶金,他正忙著補覺,把失去的時間睡回來。
柯國霖說,比賽對他最大的震撼是看到學術界和工業界的差別。他說,在學術界,你可以編制出很完美的算法模型,但數據可能需要“跑”幾個星期甚至一個月,才能得出結果。柯國霖說,這種模型不是工業界所需要的,后者需要的是一個小時就能跑完的模型。 |