最新消息

南洋理工科技大學彭泰權教授演講 分享海量數據分析

記者/趙廣絜報導

  新加坡南洋理工科技大學(Nanyang Technology University)教授彭泰權於五月二十七日蒞臨交通大學客家文化學院演講,彭泰權主要研究領域爲資訊網絡,在講座中,他以知名論文舉例說明跨學科的研究合作如何帶來巨大的優勢,並透過實際案例分享如何有效運用社群媒體上的龐大資料來做研究。

傳播研究的缺陷

  「傳播」是一個動態的過程,而且是在一定的社會結構下發生的。而彭泰權提到,人們在研究傳播現象的時候,大多是「靜態」的在一段時間裡面做研究,例如,在做社會調查是在一定的時間內訪問一定的人、換算他們在不同的變量上的屬性,然後分析變量與變量之間的關係,但這種方式只能抓住社會脈動動態過程的一個橫截面。而人們在做傳播研究時往往會把研究對象抽離他們所屬的社會結構,因為在做統系分析的時候,有一個假定是觀測對象之間是互相獨立的,但是實際上人類的行為或多或少會受到社會群體或所處環境的影響,這就說明傳播研究在概念與實證上是存在著一定的差距的。「有些人批評傳播學片面的研究無法建立因果關係、也無法反映社會現實,有時候的確令人難以反駁。」彭泰權說道。

  而近十年來,許多學者提倡將「計算」(Computational)運用在社會科學的研究上,甚至將計算的思維引入各個學科。彭泰權認為,計算可以為傳播研究建立一個橋樑,將傳播在概念上的定義以及實證上的研究連接在一起。

計算機概念 自動化與抽象化

  計算有兩個重要的概念,首先是「自動化」(automation)。舉例來說,在做內容分析的時候社會科學家會將素材進行人工的編碼,但是現代研究需要面對海量的文本與數據,傳統研究方式難以執行,所以需要計算機學上所謂的「自動化」概念;而另一個計算的重要概念則是「抽象化」,它適合運用在量化的研究上,方法是將人類複雜的、渾沌的行為,透過最簡單卻最抽象的語言「數學公式」來表示出來。彭泰權表示,「抽象化」的目標是希望在研究時能夠把人的傳播行為、態度、觀點測量出來, 找出一個放諸四海皆準的公式。

  所謂的「計算社會科學」,指的是現在學術界崛起、且正在蓬勃發展的領域。這個領域的研究蒐集了網路上使用者生產的內容、以及人類在社群媒體上的趨勢,透過這些海量數據的分析,可以發現人類行為的規律。

運用海量數據做分析

  Google搜尋趨勢(Google Trend)是其中一項工具,它可以透過使用者搜尋的關鍵詞來分析公眾對某個議題的關注程度。彭泰權以某年對流感的研究為例子,該論文的作者將Google Trends的搜尋趨勢與美國疾控中心的活動趨勢放在同一個時間軸並著手分析,發現Google能夠提前七天預測流感的爆發。如果這種傳播研究結合計算概念的跨領域合作持續發展,除了獲得學術上的成就,也對人類社會有莫大的貢獻。

  除此之外,Google搜尋趨勢還可以透過使用者內容的海量資料來分析各種議題,像是國家的影響力排名、美國民意代表選舉的當選機率等等。不過彭泰權也提到,海量數據不一定能解決所有問題,重點是要懂得如何掌握有用的資訊,並且建立研究的信心與效度。

  在演講的最後,彭泰權也分享了自己進行跨學科研究的心得。他說進行起來很費時間、不一定會成功,因此雙方的溝通與瞭解很重要。他說:「身為社會科學家或是傳播學者,需要懂得計算機語言,並且把自己所屬領域的理論用對方的語言解釋給他們聽,這點非常的重要。」

  而在演講隔天的五月二十八日,彭泰權也在客家文化學院舉辦「社交媒體探勘工作坊」,講解如何運用Google搜尋趨勢(Google Trend)及推特(Twitter)兩個平台,進行資料處理、分析以及最終的資料呈現。