【今周刊】台灣資料科學教父:好奇心比程式能力重要

出版時間 2016/09/04
台灣資料科學教父:好奇心比程式能力重要
台灣資料科學教父:好奇心比程式能力重要

本內容由今周刊官網提供

如果要找功力最高強的大數據人才,恐怕不在業界,而是在學術界。中研院資訊科學研究所研究員陳昇瑋,是國內玩過資料種類最多的人。目前他手上超過十個專案與業界、政府合作。「我想與一家麵包店合作,只要兩個多月就可以告訴麵包店老闆,麵包如何配料,如何取名會賣得更好。」陳昇瑋腦中就像魔術師的那頂神奇高帽,隨時變出花樣來。

求廠商「施捨」資料
從中發現「沒人看出來」的祕密


戴著細框眼鏡以及一臉自信的笑容,陳昇瑋一談到「資料」就滔滔不絕。在今年夏末舉辦的台灣資料科學愛好者年會上,他可以從早上九點聊到下午四點,讓台下聽眾無不凝神聆聽,信手拈來好幾個案例,靠的全是十多年來扎下的基本功。


二○○三年,就讀台大電機系博士班的陳昇瑋,在思考論文題目時發現,相較於寫出一套完美的理論模型,他更喜歡研究貼近現實的資料。他認為:「模型雖然漂亮,但你一定沒辦法完整描述這個世界;相較之下data driven(沒有先入為主的直覺,而是純用數據佐證)比較ugly(不好看),但是它是從現實資料來的。」

但是,要取得業界的資料談何容易?在台灣,除了業界、學界鮮少合作外,業界都對自己的資料保密到家。更何況,當時「資料」一詞,不像現在有大數據的加持,許多廠商雖空有資料,卻不清楚重要性。「所以,那時候很辛苦,都要求人『施捨』資料給我,就像窮人借錢,只能一個、一個朋友問。」陳昇瑋無奈地表示。

把所有朋友都問過一輪後,終於靠朋友牽線,認識了宇峻奧汀遊戲公司(旗下知名遊戲包含:〈絕代雙驕〉、〈神舟online〉)的員工,願意提供資料給他做博士論文。經過分析,陳昇瑋發現這款線上遊戲,在伺服器設定上出了問題,導致原先應該輪流輸送的流量,變成同時輸送,反而讓總流量變少。在那之前,遊戲公司雖發現網路不穩,卻一直認為是品管出了問題。

「直到那時,我才知道資料的威力,那個遊戲我只玩過一小時,卻比日夜泡在遊戲裡的開發人員還懂,」陳昇瑋補充:「透過資料,可以發現...(閱讀全文

延伸閱讀:念科技不再吃香?大學生最愛讀這些
 


一指在APP內訂閱《蘋果新聞網》按此了解更多