社會工作質性評估研究的回顧(1990-2003):對中國社會工作的啟示
Abstract:Objective : This paper reviewed and examined the quality of all the qualitative evaluation studies indexed by two key search terms of “qualitative ”and “evaluation”in the Social Work Abstracts database from 1990 to 2003 against a number of criteria typically adopted in the field of qualitative research. The review led to a dissatisfactory finding of the low quality of many qualitative evaluation studies due to their insensitivity to the following issues : philosophical basis of the study , auditability (detailed documentation of the participants and data collecting procedure) , biases (acknowledgement of biases and preoccupation , and steps to deal with them) , credibility or trustworthiness (triangulation , peer checking and participant verification of the findings) , consistency (reliability consciousness and audit trails) , and critical interpretation of the data (alternative explanations , disconfirming evidence , and limitations of the study) . It was recommended that researchers be cautious when utilizing findings from the published qualitative evaluation studies ; that social workers be sensitive to the issue of quality when conducting qualitative evaluation studies ; that researchers be critical when judging the qualitative evaluation studies in social work; that researchers develop a clear set of guidelines for qualitative studies ; that social work training institutes design qualified qualitative research courses ; that a database of social work in China be established; that researchers be engaged in more qualitative studies that demonstrate high quality; that myths in qualitative research be debunked; and that adequate training for social workers on qualitative evaluation studies be provided.
Keywords:qualitative research , evaluation , social work literat ure , evaluative criteria
作者:石丹理 香港中文大學社會工作學系教授;韓曉燕 上海社會科學院青少年研究所;鄧敏如 香港中文大學性別研究課程碩士研究生
在社會科學的歷史中,定量和定性研究的爭論持續了差不多半個世紀。隨著研究者對實證主義的質疑,質性研究的數目逐漸增加。根據布瑞曼(Bryman ,1988) 的看法,質性研究有以下特點: (1) 透過被訪者的眼睛看世界; (2) 描述日常生活情境的細節; (3) 了解在不同社會范疇的背景中的行為及意義; (4) 強調過程; (5) 傾向采用文字及結構靈活的研究設計; (6) 盡量避免在研究初期確立理論和觀念。鄧澤和林肯(Denzin & Lincoln ,1998) 也指出,質性研究有以下元素: (1) 采用多元的研究手法; (2) 涉及自然和詮譯的角度; (3) 在自然的情況下作出研究; (4) 嘗試理解和分析不同現象的意義; (5) 傾向歸納多于驗證; (6) 批判實證主義的研究方法。
社會工作是一門應用的學科,社會工作者很多時候都會透過社會科學的研究方法,了解社會工作者介入手法的成效。隨著質性研究方法的逐漸普及,社會工作者很多時候都會應用質性研究方法評估其工作的成效。
很多證據顯示,在社會工作領域中,質性研究的數量在不斷上升。截至2004 年1 月,對“社會工作摘要”的文獻搜索結果顯示,以“量性”(quantitative)作為搜索詞共有492 篇論文發表,而以“質性”(qualitative)為搜索詞則有1 ,238 篇。布倫(Brun ,1997)回顧1982 年至1992 年發表的54 篇社會工作博士論文,指出質性研究論文在十年里增加了三倍。同樣,德爾格蘭和霍亞(Dellgran & Hojer ,2001)對社會工作專業學位論文的文獻回顧指出,在1979 至1998 年的89 篇博士論文中,有一半是質性研究,而量性研究只占14%,另有36%是混合兩種方法的研究。羅伯特(Robert ,1988)亦指出,修讀社會工作的學生傾向選擇質性研究方法。
在華語學術界中,因有關社會科學文獻的數據庫發展得較慢,我們較難收集完整的統計數字去了解質性研究發展的趨勢。不過,從一些博士論文的研究中,我們仍可得到一些關于質性研究發展的資料。就社會工作和社會福利博士研究生的培養而言,香港比大陸和臺灣地區起步早、發展快。以香港中文大學社會工作學系為例,從它們開始招收博士研究生到2003 年,一共有14 篇博士論文。在這14 篇博士論文中,有7 篇是純質性研究,(注1)有6 篇是量性加質性研究,(注2)而只有1 篇是純量性研究。
隨著社會工作文獻中質性評估研究的日益增加,有一個重要的問題必須予以提出:在社會工作范疇里這些研究的質量如何? 面對社會工作專業日益強調質性研究的狀況,特亞( Thyer ,1989 :309) 明確指出,質性研究的倡導者必需為該專業提供有關社會工作實務結果的一些正面的研究案例,并建立起從事研究和評估的清晰標準。遺憾的是,迄今為止尚未有任何研究對此作出回顧,正是在這樣的背景之下,本研究試圖填補這一知識空隙。
一、質性研究評價標準
當我們試圖去評價社會工作質性評估研究的質量時,首先遇到的一個問題便是: 這些標準是否存在(Lathar , 1986 ; Lincoln & Guba ,2000 ; Seale , 2002) ? 對這個問題,研究者有兩種不同的觀點。一種觀點是: 建立“有效的”標準是不可能的,事實上也沒有必要。堅信社會建構主義(Schwandt , 2000) 和后現代(Bloland , 1995) 的研究者多持此種觀點。例如切萬特( Schwandt ,1996 : 70) 指出:“我們必須‘告別標準學’”,就是說社會科學研究者必須放棄對獨立存在的、無可爭議的、目的在于將那些“合法”的與那些“不那么合法”的社會科學知識予以區別開來的標準的追求。不過,面對“后現代主義”高漲的情緒,一些研究者指出有關說法不過是“時髦的胡說八道”(Sokal & Bricmont , 1998) ,并質疑如此相對主義的觀點與社會工作價值觀是否一致(At herton & Bolland , 2002 ; Rubin , 2000 ) 。最重要的是, 在強調問責(accountability) 重要性的今天,對公眾和社會工作專業人士而言,讓他們接受以下這個觀點是很困難的:通過質性研究方法無法區別“好的”和“壞的”社會工作實務。
另一方面,一些研究者強調建立評價質性研究質量的標準是必要的,也是可能的( Huberman & Miles , 1994) 。然而,文獻回顧顯示,在評價質性研究方面有著不同的標準,帕頓( Patton , 2002) 對不同范式的標準作了全面概述,明確指出持不同世界觀的研究者使用的是不同的評價標準。在傳統的“實證主義”范式里,采取的標準包括研究者的客觀性、資料的效度、田野工作程序的系統周密性、三角測量、編碼的信度和分析的模式、研究發現與事實的對應、外部效度,以及支持因果假設的證據之強度等。在建構主義范式里,研究者則使用以下標準來評價質性研究:對主觀性的承認、對可信性、真實性、三角測量、研究者的反思、現實性、獨特性,以及深度理解的程度等。對那些強調藝術和創新原則的研究者來說,評價標準包括創造性、審美質量、解釋的生動性、激勵程度、獨特聲音的表達、“真實”感和真誠程度。最后,持批判理論觀點的研究者則傾向于采取以下標準:研究者是否增強了人們對不公平的意識,辨別了不平等和不公平的本質和根源,表達了無權者的觀點,增進了研究者和被研究者之間的合作程度并對被研究者有所增權等。
就后實證主義而言,研究者提出了評價質性研究質量的不同標準。賴康特和高茲(LeCompte & Goetz ,1982) 提出四個標準:內部信度、(注3)外部信度、(注4)內部效度(注5)和外部效度。(注6)三角測量(注7)也是通常被用來評價研究效度的另一標準( Tschudi , 1989) 。
在另一個極端,建構主義范式也提出了一些標準。葛巴和林肯( Guba & Lincoln ,1981) 認為應使用以下標準:可信性、(注8)適宜性、(注9)審核性(注10)和可證實性。(注11)
桑德羅斯基( Sandelowski ,1986) 對審核性特別關注,并提出了加強質性研究審核性的幾種方法,包括對以下這些方面加以清晰地闡述、解釋和論證: (1) 研究的合理性; (2) 研究者對該主題的觀點; (3) 研究目的; (4) 被研究者如何參與; (5) 研究者和被研究者之間的相互影響; (6)資料收集的詳情; (7) 資料分析和轉錄的詳情。
休伯曼和米爾斯( Huberman & Miles ,1994) 站在批判現實主義的立場上,試圖對后實證主義和建構主義兩大觀點進行整合和反省,提出了5 個標準: (1) 客觀性/ 可證實性:研究結果的中立程度和研究者偏見的相對影響; (2) 信度/ 可靠性/ 審核性:在不同時段、不同研究者和不同研究方法下研究的程序是否一致和相對穩定; (3) 內部效度/ 可信度/ 真實性:研究發現代表現實的可信景象的程度; (4) 外部效度/ 可轉移性/適宜性:研究發現適用于最初研究脈絡的程度; (5) 利用/ 應用/ 行動面向:研究發現是否能提高被研究者的理解水平,并促使他們采取行動改
善他們的處境。
在社會工作領域中,有關質性研究質量的研究和文章十分欠缺(Anastas , 2004 ; Drisko , 1997) 。德瑞斯克(Drisko ,1997) 指出社會工作缺乏深入和詳細的檢討準則來評估質性研究的質量。為此,他提出6個標準:標準1 ,詳述研究的哲學框架——因不同的哲學框架有不同的質性研究方法,故此有必要清楚交待研究的哲學背景及有關假設;標準2 ,詳述研究的目標與受眾——因不同的研究目標與受眾要求不同的研究方法,故研究者必須交待研究設計怎樣達致研究目標;標準3 ,詳述研究方法——必須詳細描述研究方法,以幫助讀者了解其研究方法與研究哲學是否吻合;研究方法的詳述應包括樣本、研究結果跨范疇的推論能力、資料搜集方法及資料分析;他還提出四個檢測質性研究資料分析的策略,包括分析是否可信、研究結果是否放在不同范疇加以理解、研究結果是否有不同角度的支持及研究結果是否飽和;標準4 ,找尋誤差——因質性研究很容易受到研究者和被研究者的影響,研究者必須清楚交待處理誤差的方法;標準5 ,堅持社會工作倫理價值觀——質性社會工作研究應與社會工作實務一樣,強調倫理原則;標準6 ,結論與研究哲學和資料的一致性——研究者必須指出其研究的結論是否經過小心的處理和基于研究結果。
阿那斯塔斯(Anastas , 2004) 提出7 個準則: ( 1) 清晰的研究問題——包括清楚界定研究問題、知識論基礎及有關觀念; (2) 有效地運用理論及以往研究——研究意義必須在現存研究的范疇中確立; (3) 詳述研究者和被研究者的關系——因研究者與被研究者在不同研究中有所不同,研究者必須清楚交待有關資料; (4) 研究的倫理標準——研究者必須堅守社會工作研究的倫理標準,包括保密、得到參與者同意,及參與者的身份不容易被確認等原則; (5) 清楚交待研究方法,包括抽樣、資料收集方法及分析方法——如欠缺這些資料,其它研究者要進行相同的研究將會有困難; (6) 數據的可信性——應透過不同的策略去提升研究結果的可信性; (7) 有效地呈現研究結果——研究者需謹慎地提出研究結論及其支持數據。
基于以上討論和文獻回顧,本研究擬采取以下標準:首先,在質性研究中有著許多不同的范式,這些不同的研究范式的哲學基礎亦迥然有別( Patton , 1990 ; Denzin & Lincoln , 2000) ,因此,簡單地告知讀者該研究是否為質性研究幾乎是沒有多大意義的。所以,研究者有必要清晰地指出該研究是基于“一般的”(注12)還是“特殊的”(注13)質性取向。換句話說,對質性研究者來說首先必須清晰地闡明研究的哲學基礎(標準1) ,因為在不同哲學基礎之上的質性研究要求采取不同的資料收集、資料分析和資料解釋方法。
其次,基于審核性原則,對參與者的詳情作出清晰的說明是很重要的,包括該研究參與者的人數和特點,以及樣本選取的理由等。根據帕頓(1990) 的建議,質性研究抽樣有不同方法,包括強度抽樣、非正常個案抽樣、典型個案抽樣和最大變量抽樣等,而且不同的研究在使用這些方法時的理由也有所不同。為了使其他研究者能夠更好地理解并重復地進行類似研究,研究者有必要對參與者的數量和特點作出清晰的說明和闡述(標準2) 。同樣,基于審核性原則,還有必要對研究過程和研究程序作清晰詳盡的闡述(標準3) 。例如,通常社會工作研究者都會籠統地說采用的是“深度”訪談的方法,然而,只是做一到兩小時的訪談并不能算是真正意義上的“深度”訪談。所以,研究者還必須對“深度”這個詞做出更為詳細的說明。
另一個考慮涉及到“批判反思性”這一概念(Lincoln & Guba ,2000 ; Ryan , 1998) ,根據社會建構主義者的觀點,在社會科學研究中偏見是不可能被消除的,因此,對研究者來說很重要的一點便是意識到自身所存在的偏見和先入之見。斯迪爾( Steier ,1991 :2) 指出,研究者原本希望就他們的研究對象(如某社會群體) 說點什么,但他們發現在這樣做的時候,他們所說的話其實正是關于他們自己的,所以研究者必須意識到自己的看法和偏見。洛塞瑙(Rosenau ,1992 :114) 也指出,以下兩點對研究者來說是非常重要的:承認“將所有合乎規范的價值觀棄置一邊是不可能的”,以及“清晰地提請讀者關注研究者自身已有價值觀的存在”。因此,研究者是否清楚地闡明他們所持的偏見和意識形態方面的先入之見是很重要的(標準4) 。此外,由于在質性研究中研究者和被研究者之間的頻繁互動可能產生偏見,而且研究者可能意識不到自己的主觀偏見( Huberman & Miles , 1994) ,因此,詳細討論如何才能使偏見減到最小是很重要的。對那些不相信偏見是可以消除的人來說,他們也必須提出論據,指出偏見為什么不可被消除(標準5) 。
后實證主義評價研究質量的兩大概念是“信度”和“效度”。基于可信性原則,編碼與研究者的解釋是否一致很重要。通常,人們會問該研究是否做了評分者內在信度檢定(注14)和跨評分者信度檢定(注15)及思考相關的問題(標準6) ?;谌菧y量原則,研究結果是否經不同的研究者、數據來源和研究方法檢定也是一個重要的考慮(標準7) 。
雖然在建構主義文獻里沒有明確地提出“效度”,但是研究者非常強調知識的“共同性”(communal) 特點,林肯(Lincoln ,1998) 建議將“公共群體”( community) 作為質量的裁判者。瑞佐、考薩羅和巴特斯(Rizzo ,Corsaro & Bates ,1992) 提出了檢驗質性研究質量的兩條途徑,即同伴檢驗(注16)和參與者檢驗。(注17)因此,公共群體成員的檢驗(包括同伴檢驗和參與者檢驗) 便成為評價質性評估研究的另一標準(標準8) 。
同樣,雖然建構主義者沒有普遍地強調“信度”,但卻較為推崇“審核性”原則。桑德羅斯基(1986 :34) 指出,如果研究者能將有關該研究從開始到結束的的一切決定均予以清晰地闡明,那么這個質性研究的審核性便是高的,任何一位讀者或其它研究者都能跟蹤該研究的每一步進展并理解其中的邏輯?;谏鲜鲈瓌t,研究者是否意識到“審核路徑”(audit trail , Huberman & Miles , 1994) 的重要性并對資料、觀點、決定和情景予以清晰地闡述也是質性研究的評價標準之一(標準9) 。
最后三個標準與資料的批判性解釋和分析有關?;诤髮嵶C主義思想的邏輯思考精神和社會建構主義的批判反思觀念,研究者是否清楚地闡述了研究發現的不同可能性解釋也應該作為評價質性研究的標準(標準10) 。由于質性資料并不總是整合一致的,常常會存在一些與研究結果相左的獨特個案,因此,研究者是否適當地闡述和解釋這些“負面個案”( negative cases) 也可作為評價的一個面向(標準11) 。最后,基于批判理性主義( Gambrill , 1999 ; Gomory , 2000a , 2000b) 和批判反思性(Lincoln & Guba , 2000 ; Ryan , 1998) 精神,研究者是否意識到研究的局限性并將之清晰地闡明也是質性研究質量評價的標準(標準12) 。
二、研究方法
(一) 質性社會工作評估研究:1990 - 2003
本研究以“質性”(qualitative) 和“評估”(evaluation) 兩個關鍵詞在“社會工作摘要”( Social Work Abstracts) 上進行搜索, 搜索時限為1990 年至2003 年,截至日期為2003 年12 月31 日,共有75 篇質性評估研究,除了發表在非社會工作雜志上的論文以及不是針對社會工作介入評估的研究外,最后共有28 篇質性評估研究符合本研究的要求,因此,本文即是對這28 篇研究的評價(參見表1 和表2) 。
(二) 評價標準
基于上述詳細討論,本研究采用以下12 項標準對28 篇質性評估研究作出評價:
標準1 : 清楚地陳述研究的哲學基礎;
標準2 : 以充分理由說明參與者的數量和特點;
標準3 : 詳盡闡述資料收集的程序;
標準4 : 對研究者的偏見和先入之見作出交待及討論;
標準5 : 闡述預防偏見的步驟,對“偏見必須予以消除”或“偏見是難以被消除的問題”提出討論;
標準6 : 信度的測量(跨評分者信度和評分者內在信度) ;
標準7 : 在研究者和數據類型方面的三角測量;
標準8 : 同伴核對和參與者檢驗程序
標準9 :對“審核路徑”重要性的意識;
標準10 : 研究發現的其它可能解釋之考慮;
標準11 : 對負面證據提出解釋;
標準12 : 清楚地陳述研究的局限。
(三) 評價程序
第一步,三位作者分別依據以上標準對每一項研究進行評價;第二步,是由第二作者和第三作者依據12 項評價標準將28 篇研究的評價結果用計算機制作成表,然后交給第一作者比較和檢驗;接著依據所列評價標準進行三位研究者之間的跨評分者信度測量,對那些未能達成共識的部分,再通過討論加以解決。
三、研究結果
(一) 跨評分者信度測量
總的說來,信度分析顯示在第一作者、第二作者和第三作者之間達成的共識是高的,這表明本研究結果是在三位評價者一致同意的基礎上做出的。
(二) 研究質量評價
從標準1 來看,大多數研究采取一般的質性研究取向(N = 22) ,只有少數研究對研究的哲學基礎展開討論(N = 8) 。
關于標準2 ,結果顯示只有個別研究對參與者數量提供充分的理由加以說明,對參與者特點加以說明的也只有一半左右。至于標準3 ,也只有13 項研究做到了這一條。此外,只有2 項研究應用了計算機軟件。以上結果表明這些研究都沒有詳盡到可以重復進行的程度。
至于標準4 ,分析結果顯示只有4 項研究對研究者所持有的偏見和先入之見提出了討論。同樣,只有9 項研究談到了如何預防偏見和先入之見的問題(標準5) 。
當涉及到用后實證主義觀點評價的時候,結果顯示只有3 項研究討論到跨評分者信度問題,但沒有一個研究對評分者內在信度有所涉及(標準6) 。至于研究者方面的三角測量,也只有在6 項研究里是多名研究者合作進行的(標準7) 。與之形成對比的是,絕大多數研究在數據類型方面均采取了三角測量的方法,這也許與我們所回顧的這些研究大多數是采取混合性研究方法有關。
在運用比較貼近建構主義范式的評價標準進行分析時,結果表明幾乎沒有研究采取同伴核對和參與者檢驗(標準8) 。此外,分析結果還顯示研究者沒有很好地意識到審核性的重要(標準9) ,在28 篇研究里,只有5 篇特別強調審核路徑的問題。事實上,“審核性”和“審核路徑”這兩個名詞也很少在這些研究里提到。總之,無論是運用后實證主義范式的標準還是建構主義范式的標準,結果顯示目前的社會工作評估研究質量并不太高。
那么,這些質性評估研究的批判性程度又如何呢? 結果顯示有13項研究考慮到其它解釋問題(標準10) ,有18 項研究談到了負面證據(標準11) 。最后,在社會工作領域進行質性評估研究的研究者不太具有批判性,因為只有8 項研究清楚地討論到了研究局限的問題(標準12) 。
四、討論
(一) 本研究特點
作為對發表于1990 至2003 年期間的質性社會工作評估研究質量所進行的一項質性研究,本研究有以下特點:首先,本研究所持的是后實證主義立場,即研究者相信有可能建立起一定的標準來區分“好的”和“差的”質性研究。此外,本研究采取后實證主義和建構主義范式的多元標準對所回顧的研究作出評價。其次,為了便于其它研究者作同樣的研究,研究者清晰地闡述了所回顧的論文和回顧的程序。第三,針對社會工作領域質性研究中對個人先入之見的處理較為欠缺的情況,本研究采取了三位研究者合作的方式,而且在研究過程中三位研究者先對回顧的論文作出獨立的評價。第四,為了提高評價的精確性,本研究計算跨評分者信度檢定,對三位獨立研究者的觀點進行三角測量。最后,研究者明確指出了本研究所存在的局限。
(二) 本研究發現
通過本次研究,我們有幾點特別的發現。首先,在社會工作領域里大多數質性評估研究采取的是“一般的”質性取向,只有個別研究采取“特殊的”質性取向。當然,我們認為采取“一般的”質性取向無可厚非,但最大的問題是研究者很少清晰地闡述進行研究時的哲學基礎。帕頓(1990) 概述過質性研究的特點:自然狀態下的研究、歸納式的分析、整體性的觀點、高質量的資料、個人的洞見、動態的體系、獨特的個案取向、對脈絡的敏感性、同理心方面的中立和研究設計的彈性。由于不同的研究者對以上要素的側重有所不同,而且“質性”一詞對不同的研究者有著不同的意義,因此,對研究的哲學基礎沒有予以清晰地闡述是一個根本性的缺點。例如,在批判現實主義取向下所做的質性研究與持激進社會建構主義觀點的研究者所做的質性研究是迥然不同的。
第二個發現與審核性原則有關。依據標準2 、標準3 和標準10 ,我們有兩點觀察。第一點是有關研究對參與者的數量和特點基本上都沒有給予詳細說明。雖然質性研究并不要求達到推論的目的,但是對將來進行同類研究的研究者來說,清楚地闡述參與者的人數和特點以及相關資料是重要的。此外,對于諸如持扎根理論取向的質性研究來說,通過備忘錄展示抽樣程序,以及依據理論抽樣選取參與者的詳細說明等亦是不可或缺的資料。第二個觀察是研究者普遍對資料收集程序未予清晰詳盡地闡述??偟恼f來,本研究所回顧的這些質性評估研究對審核性原則的關注是不夠的,事實上研究者們很少提到“審核性”和“跟蹤檢驗”這兩個詞,對有關決定的蹤跡(特別是如何進行資料分析) 也沒有加以清楚說明,這樣,研究的外在信度便可能受到嚴重質疑。
第三個發現是關于研究者的偏見和先入之見(標準4 和標準5) 。質性研究的一個基本特點便是研究者必須對自己的意識形態偏見和先入之見保持足夠的敏感。遺憾的是,雖然對偏見和先入之見的誠實反省和詳盡討論如此重要,但在我們所回顧的這些研究中卻很少做到。同樣,這些研究也較少討論到采取怎樣的步驟預防偏見或者對無法消除偏見的論點進行討論。以上發現表明,社會工作者在進行質性研究時對偏見問題沒有引起足夠的重視。
第四個發現是關于真實價值(truth value) 和一致性(consistency)的問題。依據實證主義關于信度和效度的概念,研究結果發現很少有研究者進行信度測量。盧賓(Rubin ,2000 :12 - 13) 在響應后現代思想的挑戰時,質疑質性研究者為什么不確立研究結果的信度以提升研究質量。遺憾的是,我們的回顧發現社會工作評估者對信度問題太過忽視了。而且,社會工作者是否對信度抱有正確的觀念也值得懷疑。例如薩西多和科塔(Salcido & Cota ,1995 :44) 認為由于他們的研究“是不帶任何特殊假設的描述性評估,因此不必作跨評分者信度檢驗”,這句話很令人費解,因為對“不帶任何特殊假設的描述性評估”進行跨評分者信度檢驗是完全合理的,在技術上也是可行的。就三角測量而言,在同一研究中比較不同研究者的結果也不甚令人滿意。簡而言之,依據傳統的信度和效度標準,本研究所回顧的研究是令人失望的。
那么,當我們采用建構主義標準時,真實價值和一致性的問題又如何呢? 事實上研究結果依然不甚理想。就拿同伴檢驗來說,社會工作研究者似乎對這一研究技術頗不熟悉,在我們所回顧的這些研究中較少提到。此外,參與者也很少受到邀請來對研究者的解釋提出意見,這表明社會工作研究者過分重視自己的解釋而忽視參與者的解釋。
最后一個值得強調的發現是,我們所回顧的研究在資料的分析和解釋方面沒有體現出足夠的批判性,極少數研究者提到了其它可能的解釋和負面的個案,對研究局限加以明確指出的也只占很小的比例,這說明社會工作研究者對建構主義所珍視的批判反思性觀念頗不敏感。
簡而言之,通過以上分析我們可以得出這樣的結論:近十幾年來社會工作質性評估研究的質量不太令人滿意,社會工作研究者對研究質量問題沒有引起足夠的重視。從歷史發展來看,質性研究者曾經批評實證主義為“天真的現實主義”。具有諷刺意味的是,我們所回顧的這些質性評估研究所存在的局限性,包括對研究的哲學立場、審核性、偏見、真實價值、一致性和批判性解釋等缺乏足夠的敏感,這些正是會導致另一種形式的“天真的現實主義”的基本因素(以上分析參見附表1 、附表2) 。
(三) 本研究局限
本研究主要有以下局限:首先,由于本研究是對“社會工作摘要”上的社會工作質性評估研究進行分析回顧,因此研究結論不能推論到該摘要以外的其它研究。當然,被“社會工作摘要”所摘錄的雜志都是鼓勵社會工作研究者發表高質量質性評估研究的。所以,這個數據庫的研究應該說在很大程度上反映了社會工作研究的素質。第二個局限是本研究所采用的評價標準是基于質性社會工作評估研究有“好”和“差”之分的信念,因此,對那些站在后現代主義立場上的人來說,他們肯定會反對其中的一些標準。然而我們必須強調指出的是,本研究所使用的這些評價標準基本上反映了后實證主義和建構主義兩方面的立場。第三個局限是在本研究中我們只采用了研究者之間的三角測量和跨研究者信度檢驗,在以后的研究中,我們還應該采用諸如同伴檢驗等其它方法來提高分析質量。
(四) 研究結果對中國社會工作的啟示
張敏杰(2004 :63) 指出,“到1979 年為止,社會學和社會工作專業在中國大陸中斷了近30 年”。中國社會工作專業的恢復,是在1980 年代中開始的,且發展迅速,到2003 年已有近180 所大學和大專院校開設了社會工作專業,但社會工作學系還是很少。此外,國內目前尚沒有批準招收社會工作碩士,因此,復旦大學社會學系與香港大學社會工作和社會行政學系聯合于2000 年招收社會工作(MSW) 和社會行政管理(MSSM) 兩個專業的碩士,這在中國大陸尚屬第一。由于沒有碩士學位,因此在本科生課程設置中基本上只有方法論課程,而且多偏重量性研究方法,較少質性研究方法。值得一提的是,由于目前大陸對服務項目的評估研究很少,我們以社會服務和評估研究這樣一些關鍵詞進行搜索也沒有發現有價值的論文,更談不上以質性研究方法來評估了。最重要的是,雖然社會工作訓練課程不斷增加,張敏杰(2004 :66) 卻指出專業研究者人力不足,研究水平有問題——“20 年來,雖然我國出現了一些水平高,成果多的社會工作研究者,在他們的培養指導下,近年來又產生了不少優秀的年輕學者,但是以社會工作為方向的專業研究者無論在數量上還是在質量上,都落后于其它社會學科,其中高層次的社會工作者尤其缺乏”。
面對社會工作研究急速發展但研究人才不足的情況,社會工作者對研究方法的掌握很可能會有問題。所以,中國必須提升社會工作者的研究水平。本文的研究結果,對中國社會工作有七方面的啟示。我們可以用七個“C”字來總結這些啟示。
啟示1 :謹慎地應用質性研究(Cautious Use)
本回顧清楚地指出,社會工作質性研究的質量參差不齊,可信性亦有很大的差別。在香港的社會工作質性研究中,我們也發現水平參差不齊,一般研究水平都不太高。所以,社會工作者應用有關的研究結果時必須謹慎,以免應用錯誤的知識。
啟示2 :批判地使用質性研究(Critical Use)
無論基于批判理性主義( Grambrill , 1999 , 2004 ; Gromory ,2000a , 2000b) 還是批判反思論點( Steir , 1991) ,社會工作者的批判思想非常重要?;谶@些觀點。社會工作者必須批判性地質疑來自質性社會工作評估研究的發現是否可信。根據甘里爾( Gambrill ,1999) 的觀點,社會工作者應該從質性評估研究中得出“基于證據”而非“基于權威”的結論。此外,社會工作者必須意識到不加批判地接受低質量的質性評估研究最后可能導致更多低質量的質性評估研究。石、林和蔡(Shek ,Lam & Tsoi ,2004) 指出,華語圈的社會工作者較易信服權威,而在香港以證據為本的角度執行社會工作實務的文化十分薄弱。所以,華人社會工作者必須提升其批判思想,特別是對質性研究的分析能力,以區分“好”和“壞”的研究。
啟示3 :建立檢定質性研究的準則(Criteria Formulation)
鑒于特亞(1989 :309) 強烈敦促質性研究者必須建立起一套從事質性研究的清晰指引,葛巴和林肯(1994 :114) 指出建構主義對質性研究的質量標準問題仍有進一步討論的需要,我們認為有必要就質性社會工作研究的標準學問題以及相關標準的建立進行深入討論。文獻回顧表明,盡管質性研究標準問題是目前學術界爭論的熱點,但在社會工作領域卻甚少涉獵。在中國的社會工作文獻中,至今尚無廣泛和深入的討論。
在論述到質性研究標準問題時,有兩點值得特別關注:第一點是許多研究者相信建立評價質性研究的標準確實是可能的。例如,哈默斯里( Hammer sley ,1990 :61) 指出“我們不必放棄與現實( reality) 相對應的真實(truth) 的概念,我們可以采取更為精妙的現實主義的態度來把握真實這一概念”。事實上,哈默斯里(1992) 力圖重建關于“真實”(truth) (不同層面的證據) 和“適當”( relevance) 概念的后實證主義和建構主義標準(Seale , 2002) 。第二,即使對那些持相對主義觀點的人來說,質量問題依然是存在的,哪怕是以一種非常微妙的方式存在。例如,盡管史密斯和迪默(Smith & Deemer ,2000 :878) 主張“必須接受相對主義”, 但同時他們也強調“相對主義并不意味著‘一切皆可’(anything goes) ”,也不是“似是而非地確定一些在任何時候、任何情況下獲得或多或少贊同、區別‘好的’和‘差的’研究的標準”(同上:894) 。我們認為,對中國社會工作者來說,現在非常有必要就質性研究的標準進行討論,并做出他們的貢獻。
啟示4 :課程設計(Curriculum Development)
就社會工作教育而言,我們認為對社會工作者必須加強進行質性研究方面的訓練。這一點非常重要,尤其是近年來質性評估研究在數量方面有迅速增長的趨勢。在對社會工作研究者進行培訓時,目標在于使他們具備以下特點: (1) 清楚了解不同類型的質性研究,把握采取“一般的”質性取向和“特殊的”質性取向進行研究的區別; (2) 敏銳地意識到審核性的重要; (3) 對自己的偏見和哲學取向保持高度的反思,并懂得如何將偏見降到最低; (4) 重視真實價值觀(三角測量、同伴檢驗、參與者檢驗) 和一致性(信度和跟蹤檢驗) ; (5) 能夠批判地分析和解釋質性資料。為了能夠培養出具有以上素質的社會工作畢業生,社會工作培訓機構有必要對目前的課程作出檢討,只有這樣,方能培養出對質性評估研究質量保持高度敏感的社會工作研究者。
在我們回顧一些社會工作訓練的課程時,我們發現質性研究的課程十分欠缺。以香港為例,當我們回顧香港大學、香港中文大學、香港理工大學、香港城 大學和香港浸會大學的本科和研究院課程時,發現有關質性研究的課程十分欠缺且授課時數都處于一個頗低的水平(Shek , Lam & Tsoi , 2004) 。
啟示5 :建立華人質性研究數據庫(Chinese Qualitative Research Database)
由于華人社會工作質性研究仍然處于萌芽期,有關的研究非常零散。長遠來說,建立一個類似“社會工作摘要”(Social Work Abstracts)的數據庫有其迫切性。此外,鑒于很多質性評估研究會以研究報告的形式呈現,而這些資料往往不會收錄在“社會工作摘要”這一類數據庫中,我們更需要建立一個包括研究報告在內的“華人社會工作質性研究”數據庫,以便研究者可以應用和檢討有關的研究。
啟示6 :進行高質量的社會工作質性評估研究(Conducting High Quality Studies)
對中國的社會工作者而言,本研究指出有必要提高社會工作領域內質性評估研究的質量。為達到這個目標,我們提出以下建議:
建議1 : 由于“質性”一詞對不同的質性研究者來說有著不同的理解,因此,研究者必須清楚地闡明該質性研究的哲學基礎;
建議2 : 研究者必須增強對研究審核性的敏感度,包括清楚地闡明研究程序,并對如何選取參與者和資料收集程序予以詳細的說明;
建議3 :研究者必須對偏見問題保持足夠的敏感,在研究中對如何預防偏見或者難以消除偏見的問題進行討論;
建議4 : 研究者必須對真實價值觀和一致性問題保持敏感;
建議5 : 研究者必須持一種批判的態度,對其他可能的解釋和負面證據予以適當考慮,并對研究局限予以清楚的闡明。
啟示7 :破除質性研究的神話(Correcting Myths About Qualitative Research)
在我們回顧社會工作質性評估研究時,我們發覺研究者對質性研究有很多神話,我們必須破除這些神話,澄清一些謬誤。
神話1 :質性研究是同類性很高的研究
其實,質性研究的分支很多,不同的哲學基礎有不同的研究方法。此外,采用“一般性”的角度和采用“特殊性”的角度也會衍生出不同的質性研究。
神話2 :質性研究是解決實證研究限制的萬應良丹
有些質性研究者以為采用質性研究就能避免量性研究的限制。其實從研究角度來看,有些量性研究的限制在質性研究里亦存在(例如研究結果重復性的問題等) 。
神話3 :與量性研究相比,質性研究較為容易和簡單
如果研究者忠于質性研究的假設和信念,質性研究的推行是相當困難和復雜的。以時間和人力資源來說,質性研究的要求往往比量性研究為高。
神話4 :質性研究沒有“好”與“壞”之分
對很多質性研究者來說,他們都反對這個觀點。其實,很多學者和研究者都對質性研究的質量提出了不同的檢定標準。
神話5 :只要我們接近參與者,我們就能夠了解“真相”
在質性研究中,雖然研究者與被研究者的距離很短,但這并不表示研究者一定掌握真理。其實,研究者和被研究者的偏見往往會影響研究者對事情的了解。如果不假思索地接納這個看法,將會是另一種天真的現實主義。
神話6 :研究者所聽到和看到的都是可信的
很多研究者以為,提供參與者的“敘述”就能確保結論無誤。其實,參與者所作的詮釋是問題的中心。所以,單單提供參與者的敘述作為證據是遠遠不夠的。此外,怎樣引述參與者的敘述而不至變成“斷章取義”也是很重要的考慮。
神話7 :因質性研究接近社會工作價值觀,所以很多社會工作者選取質性研究
其實,很多社會工作者選擇進行質性研究,只不過他們對量性研究產生恐懼(特別是統計方法) 。所以,當研究者采用質性研究方法時,他們必須反省是否因為逃避量性的方法而進行質性研究。
注釋:
* 本研究得到香港特別行政區研究資助局(研究基金編號CUHK4293/03H) 及和富(Wofoo) 基金的支持,特此致謝。
注1:主題有父母自省能力與教養子女、婦女晚年喪偶適應、子女選擇“機構式療養”以照顧失能父母、男性作為父親的經歷、臺灣地區臨床社會工作者建立助人關系經驗之敘說分析、成年子女照顧老年父母日常生活經驗及廣州市劣勢婦女需要滿足與社區就業。
注2:主題有從宗教角度看戒毒治療、中國吉林省長春 老人照顧的政策與實踐、上海城市職工研究、上海癌癥自助組織研究、“離婚家庭”中“非與孩子同住父母”參與親職的情況、在家庭治療中的重要事情對厭食癥病患者之病情及家庭關系之影響。
注3:internal reliability ,同一研究內的不同研究者的看法是否互相吻合。
注4:external reliability ,不同的研究者是否在相同或相似的場景中找到了同樣的事情。
注5:internal validity ,研究結果是否真的反映現實。
注6:external validity ,被確立的現象是否能夠適用于不同的群體。
注7:triangulation ,研究發現是否基于不同的方法、不同的資料和不同的研究者都是一致。
注8:credibility ,對人類經驗的描述或闡述是否可信。
注9:fittingness ,一個研究的發現是否適宜于該研究以外的脈絡以及讀者是否認為研究發現對他自身的經驗是有意義并可適用的。
注10:auditability ,該研究的闡述是否足夠詳盡,以致讀者能夠追隨研究者的研究足跡。
注11:confirmability ,中立性。
注12:在研究中采取質性研究的一般要素,如強調個人的主觀感受和情感中立等原則( Patton ,1990) 。
注13:采取諸如現象學、扎根理論、批判理論或人種志等特殊方法。
注14:intra-rater reliability ,即同一研究者在不同時間里分析的穩定性。
注15:inter-rater reliability ,即不同研究者之間分析的穩定性。
注16:peer checking ,邀請本研究以外的研究者或同伴對研究質量加以檢驗。
注17:member checking ,邀請本研究的參與者對研究質量加以檢驗。
參考文獻:
(略)
《社會》總第241期(2005.3)
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!