今年12月9日中山大學獲得IBM捐贈市價高達美金100萬元的「巨量資料及分析技術軟體」,因應大數據時代,該校同時成立「跨領域數據科學研究中心」,未來將協助產業從中萃取出關鍵的訊息,擬定適當的策略以提高產業獲利,目前已與國內半導體大廠、南部鋼鐵大廠、國際保險公司等知名企業進行產學合作。
學術界、科技業三句不離「大數據」都在進行有關的研究,連去年柯P在台北勝選,眾多媒體報導柯P陣營善用由網路蒐集的「大數據」來加以多面向的分析,以最貼近民意的方向隨時來調整戰略,終能以最經濟卻最有效率的方式來贏得剛開始被認為不可能的選戰。
可見「大數據」儼然繼「雲端運算」之後當前已經成為最熱門的顯學。美國在2012年就開始著手大數據,歐巴馬在同年投入2億美金在大數據的開發,並強調大數據會是之後的未來石油,可見其重要性。
然而「巨量資料」或稱「大數據」究竟是什麼?
簡單來說,就是當資料量龐大到目前一般處理資料庫系統的電腦無法在合理時間內進行處理運算和分析,而必須使用數十、數百甚至數千台伺服器同時運行特定的軟體,如同IBM這次贈與中山大學的巨量資料及分析軟體才能處理分析資料的時候,就稱之為大數據。
而大數據對一個企業的研究及使用,對內除了可以找出使用者的喜好以及需求,隨時調整產品發展的策略與方向。以上個月最夯的電競遊戲『英雄聯盟』的發行公司「Riot Games」(拳頭公司)來說,他們握有在全世界各地區所設置的伺服器裏遠超過100億(10Billion)筆玩家的各式資料,藉由公司內各相關領域的高端科學家的統計、分析、探索,得以在每年的世界比賽之後,將該遊戲全面換新面貌與比賽和登入的方式。
http://www.slideshare.net/Hadoop_Summit/big-data-at-riot-games
Riot Games 在2012年6月詳細的介紹如何應用巨量資料(圖片摘自該網頁)
對改善網路環境不遺餘力的該公司,更藉由巨量資料的分析,將原本需由人工處理類似「公民法庭」的「審判者系統」完全改由電腦辨識裁決。當電腦接收到玩家的申訴時,電腦甚至會參考該玩家過去的歷史,來辨識出被申訴的玩家是否因為當天因為總總生活上的不順而影響到心情,或真的是惡意的,隨即在五分鐘至十五分鐘之內發出勸告或警告或懲戒最重會中止該玩家的帳號,並隨即通知申訴的一方處理的情形。
由於使用巨量分析研究數據的置入,其誤判率已經低於幾乎可以忽視的五千分之一,而這被誤判的五千分之一的玩家仍可再上訴經由人工核對更正來取回權益。
我們都知道獎懲要即時,拳頭公司(Riot Games) 因為運用「巨量資料」的分析篩選來賦與電腦人工的智慧,審判系統由以往的最快須一星期才能判決,躍進為5至15分鐘內立即裁決並執行懲處。
因此玩家的不良行為降低了百分之九十二,使得英雄聯盟的社區環境已變得更為和諧良善,無形中也改善了那些本來行為不佳的玩家在現實生活中的行為。此系統的即將在全球正式上線已引起極端的關注。
玩家的申訴很快就得到回覆結果,由於正義能即時得到伸張讓他覺得感覺非常舒服 (網頁照)
至於對外,由於企業擁有的資源在人力與財務上都比學術單位要來的更為充裕,一般學術單位在做研究時,很大的一個困難就是在財務以及設備上的不足。例如在做一個有關「人類行為」的研究計畫時,若能取得10個至多200個有效的樣本時,就已經可以做出一個可被接受的研究論文。而因為Riot Games財務的不虞匱乏加以公司的全力支持,因此該公司反成為目前全世界最大的心理學研究室。
Riot Games也非常樂於支援與支持各大知名學術單位的研究,除了每年會應各著名大學的邀請前往報告與討論他們最新的研就結果與如何應用在『英雄聯盟』的電競遊戲上。英國約克大學 (York) 剛被著名的科學期刊(ScienceDirect) 接受並登出一篇有關「人類行為」的論文Computers in Human Behavior,就是由Riot Games 隨機提供該校電算機所能合理處理的最高極限45萬筆玩家的有關資料,並請該公司兩位科學家協助研究。以大數據來研究人類在虛擬網路上的行為與在真實社會上的行為的互相關聯性的第一篇論文。
有關這方面的研究其資料之取得皆需依照美國「網路研究協會」及「心理學會」的規範,僅匿名的資料能夠被分析與研究。同時所有玩家要申請加入英雄聯盟的遊戲時,皆已簽署同意資料被使用於研究。
該研究報告指出,在此電競遊戲中,可以改變玩家大範圍有關人格發展,視覺,認知學,心理學以及注意力的大腦機轉,並導致在真實社會裡行為的改善。
從這些玩家自取的名號(匿名)經過統計、分析與研究,揭示了真實世界和網路上的性格之間的相關連。一些有反社會傾向名稱的玩家,在比賽中也顯示出對社交的厭惡及沮喪以及侵略性的不良行為,相對的那些使用正向名稱的人,他們傾向於對內建立良好的關係並且會成為戰隊裏的領導人 。
研究者發現,經由這些電競遊戲的玩家數據,是研究玩家人格特質非常重要的領域,大數據並提供了潛在的有關自閉症、反社會或成癮的臨床特徵,找出這些人或許可以進一步來幫助或解決他們的問題。
他們認為這一篇研究論文只不過是從大數據研究中顯現出來的冰山之一角,他們還將繼續做深入的研究。
以上只是「巨量資料」或稱「大數據」在學術與產業上如何應用的一些描述。美國在2012年就開始著手大數據,歐巴馬更在同年投入2億美金在大數據的開發中,更強調大數據會是之後的未來石油。
中山大學成立「跨領域數據科學研究中心」發佈新聞標題:「大數據夯」已說明一切。
『英雄聯盟』徽章 (記者林崑峯攝)