當文字揭開心智:文本分析在心理學的探討與應用

  • 2024-12-23
  • 高嘉玲
2023第一屆「心智與腦科學」 - 心理、神經、與大腦 科普寫作徵文  C組心理學-優等:政大詹O臻
 
       「你會不會讀心術?你會解夢嗎?未來是要當心理醫生嗎?,這些令人哭笑不得的問題身為心理系的學生應該或多或少都被問過,我也曾在家庭聚會中遇過親戚關心晚輩們的學習狀況,問了一圈都能和其他晚輩聊個幾句,而當我講出心理系之後對方就略略點頭說個不錯後話題便戛然而止。對大眾來說心理學似乎是一個包羅萬象但又難以觸及的學科,網路、媒體的傳播更加深了各種對於心理學的刻板印象,那麼心理學究竟是什麼呢?從定義上說明的話,心理學是以科學的方式研究人的行為和相關心智歷程,因此和人相關的一切就屬於心理學探討的範疇,又可以再細分成工商心理學、發展心理學、認知心理學、生理心理學、臨床心理學等領域。因此心理學不僅僅關注心理健康和其治療方法,更包含了日常生活中牽涉到的行為決策和與群體間的互動方式。
 
        人類獨特於其他物種很大一個特點是源自於語言,有效的表達、溝通能幫助我們傳達自己的感受、分享所見所聞、建立文化,甚至促進社會發展。因此對心理學家來說了解人們如何從話語中獲取訊息、感知情緒的背後歷程是至關重要的。然而,受限於電腦技術的發展,直到21世紀初,心理學家才開發出電腦化文本分析技術(computerized text analysis),有別於過往需要耗費相當大的人力、時間才能把訊息量豐富的文本內容(例如訪談逐字稿、觀察紀錄)依照分析人員的主觀判斷進行梳理和評定,由PennebakerBoothFrancis2007所建立的語文探索與字詞計算系統(Linguistic Inquiry and Word Count,以下將簡稱LIWC)能夠藉由客觀的運算在反映個體內在的狀態、想法、態度時不會使結果受到個人主觀認定的影響。(Pennebaker et al., 2007; Chung & Pennebaker, 2007)
 
        那麼這個系統究竟是如何運作的呢?學者們認為人在語言表達中字詞的使用頻率可以作為反映個體特定心理特性的語言標記(language marker)(Pennebaker et al., 2003)例如,社會心理學認為若個體主觀認定對團體的認可、歸屬程度越高時,在用詞上使用「我們」會多過於「我」(Lin et al., 2016; Tausczik and Pennebaker, 2010)。因此LIWC系統是從詞典當中蒐集各種類型的日常用語,再由專人鑑定、歸納為代表不同語文和心理特徵的詞類(例如「我」屬於第一人稱代名詞、人稱代名詞、代名詞及功能詞),再大規模地評定這些詞類以確定它們在研究中是足夠可靠和有效的。而LIWC系統的強大之處在於可以將任何文本資料轉化成對應的64種詞類,反映出該文本所代表的心理特徵。譬如夫妻之間的相處中,如果能使用越多的「我們」在討論彼此相處的問題時,就越能正向地處理問題。(Simmons et al., 2005
 
        而在科技快速發展的現在,除了心理學家所使用的文本分析之外,資訊科學家們也期望能將對人類語言的理解應用在機器人的發展上。目前資訊科學家所研發的文本分析方法是直接透過演算法從大量文本中抽取足以代表該文本的特徵,也就是說相較於心理學家所使用的是固定、事先決定好的詞彙系統,資訊科學所採用的詞彙會依照文本的內容有所變動,有更高的可能精確掌握文本中上下文句的脈絡。例如以貝式統計為基礎的隱含狄立克雷模型(Latent Dirichlet Allocation,以下將簡稱LDA),其核心概念為每篇文章是由多個潛在主題所組成的,而每個主題則由不同的文字分配所組成,舉例來說有兩個學生各寫了一篇題目不同的作文,這兩篇作文中所使用到的不重複的文字共有100個,那麼LDA會根據這2篇文章、2個主題、100個詞會進行文章的生成,因此LDA可以幫助心理學家將每個主題中的文字分配透過機率大小進行排序,透過這些詞彙了解該主題最符合的概念是什麼。(尤譯霆,2023
 
        既然如此,文本分析的發展可以幫助我們什麼呢?根據衛生福利部的國人死因統計,在11115-2425-44 歲的前五大死因中,蓄意自我殺害(自殺)排名第二,並且有逐年上升的趨勢;政府也在112年八月推動年輕族群心理健康方案,提供15-30歲的族群每人3次的心理諮商補助,鼓勵有需求的個體們勇於求助。在自殺防治中,電話輔導則扮演了關鍵角色,其立即性有助於降低來電者當下的自殺意念,確保匿名性以減少社會情境所帶來的壓力,同時減輕來電者的經濟負擔。(南玉芬,2010)而電話輔導也提供文本分析新的應用方向,將來電者的對談內容經過專業的心理團隊聽寫成文本,並請專家依照個案的自殺意念進行分類建立資料集。這些資料集則能藉由前述所談論到的方法進行資料處裡,預測自殺意念風險並歸類可能影響自殺意念的心理表徵(王中伶,2022)。也就是說,我們可以透過文本分析了解高自殺意念的個體在電話對談時較有可能出現的詞彙內容,幫助相關人員及時辨識並給予協助。這類型的研究尚在發展的階段,但目前的結果足以證明其可行性,不僅能幫助在自殺防治的體系中更早發現來電者的需求,也能有效地支援相關心理人員的工作,讓理論化為現實為大眾的心理健康作出更多實質的貢獻。
 
 
 
 
 
參考文獻
王中伶(2022)。生命專線對談自適應重點萃取進行自殺意念分析〔未出版之碩士論文〕。國立政治大學資訊科學系。
尤譯霆(2023)。文本情緒推論:開放式與封閉式詞彙分析〔未出版之碩士論文〕。國立政治大學心理學系。
南玉芬(2010)。電話輔導於自殺防治的成效與限制。臺灣社會工作學刊,(8)157-207https://doi.org/10.29814/TSW.201001.0005
衛生福利部統計處(2023)。111年死因統計結果分析。 https://www.mohw.gov.tw/cp-16-74869-1.html
Chung, C., & Pennebaker, J. (2007). The Psychological Functions of Function Words. In K. Fiedler (Ed.), Social communication, 343–359. Psychology Press.
Pennebaker, J. W., Booth, R. J., & Francis, M. E. (2007). Linguistic Inquiry and Word Count: LIWC [Computer software]. Austin, TX: LIWC.net.
Simmons, Rachel A., Peter C. Gordon, and Dianne L. Chambless. (2005). “Pronouns in Marital Interaction: What Do ‘You’ and ‘I’ Say About Marital Health?” Psychological Science, 16, 932– 936.