亞馬遜review中包含著客戶真實(shí)的情緒反饋,增長后的數(shù)據(jù)分析也很重要。
挖掘評論并加以分析voc(客戶之聲)可以使企業(yè)更準(zhǔn)確、更有效地滿足客戶的期望,從而提高市場份額和客戶忠誠度。能夠讓企業(yè)在日益激烈的市場環(huán)境中,將有限的資源集中在更有可能被消費(fèi)者選擇和滿意產(chǎn)品上,而不是浪費(fèi)在可能失敗的產(chǎn)品上。這種方法也會幫助企業(yè)節(jié)省成本。且與消費(fèi)者創(chuàng)造了更好的情感鏈接。積極響應(yīng)客戶之聲也會提高客戶留存,增加客戶對品牌的忠誠度與參與度。對當(dāng)下如此高的獲客成本和客戶留存成本環(huán)境來說,這些好處不容小覷。
shulex voc 通過absa(細(xì)粒度情感分析)模型,進(jìn)行voc的深度分析。
一、什么是absa?
absa是基于方面的情緒分析(aspect-based sentiment analysis, absa),是一個重要的細(xì)粒度情感分析問題,旨在分析和理解人們在方面層面的觀點(diǎn),在過去的十年中受到了廣泛的關(guān)注。在不同的場景中處理absa,引入了不同的任務(wù)來分析不同的情感元素及其關(guān)系,包括方面術(shù)語、方面類別、觀點(diǎn)術(shù)語和情感極性。
例如在淘寶中,這里對于評論信息的抽取就是典型的細(xì)粒度情感分析,買家對于手機(jī)幾個方面的評價有正有負(fù)。對細(xì)粒度的aspect進(jìn)行分析,一方面,有助買的人從自己看重的特征方面決定是否購買,另一方面,讓廠家能對自身的產(chǎn)品有更全面的認(rèn)知,從而進(jìn)行針對性的改進(jìn)。可以預(yù)想到這樣的信息抽取比單純的抽取喜歡/不喜歡更加具有應(yīng)用價值。
absa中,要體現(xiàn)出情感的是句子中的某個實(shí)體或者實(shí)體的某個方面,而不再是整個句子。例如手機(jī)是正品,但網(wǎng)絡(luò)不穩(wěn)定中的“正品,網(wǎng)絡(luò)”可以看做是方面。
二、普通情感分析與absa的區(qū)別
普通情感分析(general sentiment analysis)
主要包含兩部分:目標(biāo)(target)和情感(sentiment),目標(biāo)可以是任意一個實(shí)體或?qū)嶓w的任意一個方面,情感有積極/中立/消極(positive/neutral/negative)三種觀點(diǎn)(opinion),這里的情感只針對目標(biāo)。簡單來說就是針對一個文本分析出其對應(yīng)的情感,是一個非常簡單的文本分類任務(wù)。
absa(aspect-based sentiment analysis)
target可以是一個aspect category或一個aspect term,absa中的sentiment進(jìn)一步擴(kuò)展為opinion term和大體情緒取向(情感極性)。
二者區(qū)別圖示如下:
可以看到absa主要是擴(kuò)展了方面類別和方面觀點(diǎn)和觀點(diǎn)項(xiàng)。
舉個例子:
“我很想買這個產(chǎn)品,因?yàn)槲曳浅O矚g它的設(shè)計(jì),但它的價格不是很好。”
absa系統(tǒng)在這里的目標(biāo)是識別兩個方面:
設(shè)計(jì)和價格,以及它們相關(guān)的情緒。
換句話說,設(shè)計(jì):正面,價格:負(fù)面。
同一個文本中,不同的方面可以有不同的情感。在這個意義上,absa的輸出并不意味著是對文本中所表達(dá)的情感的一般指示,而是旨在提供一個更細(xì)化和詳細(xì)的信息。
通過一張圖快速學(xué)習(xí)一下absa中的4個關(guān)鍵情感元素:方面項(xiàng)(aspect term)、方面類別(aspect category)、觀點(diǎn)項(xiàng)(opinoin term)、情感極性(sentiment polarity):
三、absa的四個關(guān)鍵挑戰(zhàn)
從語言的角度來看,自動識別方面和相關(guān)情感的任務(wù)是一件不太容易的事情,因?yàn)檎Z言是復(fù)雜的,很多時候不容易解釋和理解。識別正確的方面更是尤為困難,因?yàn)榭蛻艨梢詮亩嗑S度表達(dá)他們的意見(例如:對于產(chǎn)品的價格、質(zhì)量、性能、設(shè)計(jì)、用途等...)。另一方面,在消費(fèi)者反饋中識別情緒相對容易,因?yàn)榍榫w通常只分為三類——正面、負(fù)面或中立。但檢索與方面相關(guān)的正確情緒也可能很棘手。根據(jù)不同情況,在進(jìn)行基于方面的情感分析時,我們會遇到以下挑戰(zhàn):
1.當(dāng)情緒來源于產(chǎn)品時:
顧客會明確表達(dá)他們對產(chǎn)品或服務(wù)的贊賞與不滿。
例如:通過寫正面的形容詞(好、不錯、太棒了)或負(fù)面的形容詞(壞、糟糕、可怕)。
也會簡單強(qiáng)調(diào)產(chǎn)品的一些特征或通過對產(chǎn)品功能的描述來表達(dá)情感。例如:
·電池持續(xù)時間長。
·烤箱升溫很快。
·脫毛器能拉動毛發(fā)。
這些例子可以被解釋為“積極的”產(chǎn)品特征(一個確實(shí)能用很長時間的電池被認(rèn)為是“質(zhì)量好”的),但如果在文本中使用類似的表達(dá)方式而不明確提及產(chǎn)品,它們就會產(chǎn)生歧義。例如:
a1. 它持續(xù)的時間長。
b1. 它升溫很快。
c1. 它能拉動頭發(fā)。
上述例子并沒有清楚地表明所指的確切產(chǎn)品或服務(wù)是什么。如果文本a1指的是“排隊(duì)”,b1指的是“手機(jī)”,或者c1指的是“剃須刀”呢?那么情緒就會是“消極的”。因此,“加熱很快”這個表達(dá)方式既可以是積極的,也可以是消極的,這取決于它所提到的產(chǎn)品(烤箱或手機(jī))。這就是為什么我們對產(chǎn)品本身的了解對于正確識別情感是至關(guān)重要的。
在shulex voc,我們會根據(jù)產(chǎn)品的特點(diǎn)定制我們的標(biāo)簽樹,以便正確檢測出想要傳達(dá)的情感。
2.當(dāng)情緒取決于目標(biāo)時:
在描述一個產(chǎn)品或服務(wù)時,客戶也可以參考其他實(shí)體。比如說:
“這個產(chǎn)品的價格不錯,我哥哥買的那個設(shè)計(jì)也不錯。”
在這個例子中,系統(tǒng)能夠檢索到文本中提到的所有方面及其相關(guān)的情感(如價格:正面,設(shè)計(jì):正面)這些是不夠的。
重要的是系統(tǒng)只能選擇:“價格:正面”這一對,因?yàn)樗桥c被檢查的產(chǎn)品有關(guān)的。“設(shè)計(jì):正面”這一對不應(yīng)該被選擇,因?yàn)樗傅氖且粋€不同的實(shí)體。
從另一個角度來看,機(jī)器需要能夠?qū)?ldquo;目標(biāo)”(當(dāng)前分析的主要產(chǎn)品/服務(wù))與其他實(shí)體區(qū)分開來。為了應(yīng)對這種挑戰(zhàn),shulex voc的nlp引擎提供了可以在文本中提到但實(shí)際上與分析無關(guān)的實(shí)體的指示(在上述例子中,“我哥哥買的那個”)。
3.當(dāng)情緒取決于評級時:
有時,客戶寫反饋時沒有在文本中明確說明情緒。這種情況普遍會出現(xiàn)在問卷調(diào)查中,公司要求客戶填寫問卷:對產(chǎn)品/服務(wù)進(jìn)行評級,同時寫下評論。
評級代表了對產(chǎn)品/服務(wù)的總體情緒,分?jǐn)?shù)通常從1到10不等。1是“最負(fù)面”的情緒,10是“最正面”的情緒。但客戶在寫反饋意見時其實(shí)很少會在文本中明確說明某種情緒。
例如:客戶在問卷中的回答是陳述其喜歡/不喜歡的方面,沒有任何文本元素可以幫助識別這串文本的情感。
問題1:您如何評價我們的服務(wù)?
評價答案:10分
問題2:哪項(xiàng)服務(wù)給你帶來的感受最好?
文字性回答:客戶關(guān)懷
顧客在回答問題時,會提到服務(wù)的一個相關(guān)特征,但沒有在正文中表達(dá)意見的取向。因此,只考慮文本呈現(xiàn)出的答案,就不可能確定他們對這方面的真實(shí)情緒。
如果對評級進(jìn)行打標(biāo),就有可能檢索到更完整的信息。簡短的回答“客戶關(guān)懷”與一個等于10的評級相關(guān)。我們可以把文本信息和評級結(jié)合起來,推斷出作者對客戶關(guān)懷的贊賞。如果評分是“3”,我們就會把這個反饋解釋為一個負(fù)面的。
在shulex voc中,我們可以通過將沒有情感的結(jié)構(gòu)化反饋文本與客戶提供的評級聯(lián)系起來來管理這種反饋。從而對情感評級進(jìn)行打標(biāo),并對反饋進(jìn)行完整的分析。
4.當(dāng)情感不像它看起來那樣時:
到目前為止,我們已經(jīng)看到了一些反饋文本的常規(guī)案例,在這些文本中情感可以被被隱含地傳達(dá)(通過我們對產(chǎn)品的了解被檢索出來),明確地傳達(dá)(但有時并不是指我們的目標(biāo)),或者完全沒有傳達(dá)出(由于非文本信息而被傳達(dá)例如問卷)。
還有一種有趣的情況,在這種情況下情感是明確傳達(dá)的,但所傳達(dá)出的情感并不是字面意思。主要是用來諷刺。在這種情況下,真正的情感與在文本層面上傳達(dá)的情感是相反的。例如:
這把牙刷三天后壞了!真的太棒了!
如果您正在尋找皮膚刺激,那就太好了!
雖然“真的太棒了”和“太好了”這兩個表達(dá)方式本身顯然是積極的,但從上下文來看,顧客想表達(dá)的是相反的情緒,因此給出了消極的反饋。這種例子強(qiáng)烈依賴于上下文,還要結(jié)合語言的理解才能甄別出來。
在shulex voc,我們會不斷檢查那些評級與文本級別的識別情緒不匹配的樣本。手動抽樣檢查低評級評論(即具有整體負(fù)面情緒的評論),對樣本進(jìn)行手動微調(diào)步驟使我們能夠檢索到客戶反饋中所傳達(dá)的真實(shí)情感。并提高識別準(zhǔn)確率。