波根和伍德沃德的數(shù)據(jù)哲學(xué)思想
追問數(shù)據(jù)究竟怎樣反映世界,這是數(shù)據(jù)哲學(xué)的核心所在?蔀槲覀兲峁┮惶讎(yán)謹(jǐn)框架的是,波根和伍德沃德的思想。波根強(qiáng)調(diào)數(shù)據(jù)存在“理論負(fù)載性”,即指出任何數(shù)據(jù)從采集直至解釋 ,都脫離不開預(yù)設(shè)的理論。而通過“干預(yù)主義”因果理論區(qū)分純粹統(tǒng)計(jì)相關(guān)與真正因果機(jī)制的,是伍德沃德。在數(shù)據(jù)泛濫的時(shí)代能夠保持清醒,這正是理解達(dá)此兩點(diǎn)所能起到的幫助。
數(shù)據(jù)如何反映客觀事實(shí)
波根表明,數(shù)據(jù)向來都不是那種“純粹的”客觀記錄。當(dāng)我們?nèi)y(cè)量一個(gè)變量之際,測(cè)量的定義、儀器的精度、分類的標(biāo)準(zhǔn)全都滲透著理論選擇。就好比在社會(huì)科學(xué)領(lǐng)域當(dāng)中,“失業(yè)率”這個(gè)數(shù)據(jù)對(duì)于“失業(yè)者”的定義方式,其本身就蘊(yùn)含著對(duì)勞動(dòng)參與情況的特定理解。這也就意味著在解讀數(shù)據(jù)之時(shí),我們必須去追問:這些數(shù)據(jù)究竟是在什么樣的理論框架下被生成的?一旦脫離了理論語境,數(shù)據(jù)僅僅只是一堆毫無意義的數(shù)字罷了。
因果推斷的關(guān)鍵是什么
名為伍德沃德的干預(yù)主義理論,給出了一個(gè)具備可操作性的因果標(biāo)準(zhǔn),即:X是Y的原因,其限定條件為當(dāng)且僅當(dāng)通過干預(yù)改變X時(shí),Y會(huì)隨之發(fā)生改變。這種思想直接對(duì)“相關(guān)即因果”的謬誤發(fā)起了挑戰(zhàn)。在進(jìn)行數(shù)據(jù)分析時(shí),我們所要尋找的并不單單是變量之間的統(tǒng)計(jì)關(guān)聯(lián),更是那種能夠支持“如果人為改變A,B會(huì)出現(xiàn)怎樣變化”這種情況的穩(wěn)定關(guān)系。這就要求我們對(duì)觀察性研究和實(shí)驗(yàn)性研究進(jìn)行區(qū)分并且對(duì)后者賦予更高的關(guān)于因果的權(quán)重。

干預(yù)主義如何指導(dǎo)數(shù)據(jù)分析
需把伍德沃德的思想落實(shí)到實(shí)際中,這就意味著對(duì)于數(shù)據(jù)項(xiàng)目來講,要積極主動(dòng)去開展設(shè)計(jì)干預(yù)工作。要是沒辦法開展物理實(shí)驗(yàn),那就應(yīng)當(dāng)尋覓自然實(shí)驗(yàn)或者工具變量,以此來模擬干預(yù)情況。波根的視角給我們提了個(gè)醒,哪怕是干預(yù)實(shí)驗(yàn),它自身的設(shè)計(jì)也是會(huì)受到理論預(yù)設(shè)的作用的。把兩者結(jié)合到一起,這就要求數(shù)據(jù)分析師,一方面要嚴(yán)謹(jǐn)認(rèn)真地去探尋因果證據(jù),另一方面還要時(shí)刻對(duì)自身理論假設(shè)存在的局限性進(jìn)行反思,防止借助復(fù)雜的模型把根本的概念模糊給掩蓋住。
數(shù)據(jù)哲學(xué)思想對(duì)現(xiàn)代數(shù)據(jù)科學(xué)有何啟示
對(duì)應(yīng)大數(shù)據(jù)以及人工智能,波根跟伍德沃德的思想特別珍貴,容易讓人覺得數(shù)據(jù)能“自己說話”的算法之“黑箱”特性,波根告知算法的設(shè)計(jì)、選用訓(xùn)練數(shù)據(jù)全是理論嵌入的進(jìn)程,伍德沃德的干預(yù)主義發(fā)出警示,預(yù)測(cè)模型的高準(zhǔn)確率并不等同于理解了背后的因果機(jī)制,處于政策制定以及醫(yī)療診斷等一系列高風(fēng)險(xiǎn)領(lǐng)域中,混淆兩者或許會(huì)帶來嚴(yán)重后果。
于您的工作之內(nèi),或者研究進(jìn)程當(dāng)中,有沒有碰到過,因?yàn)閷?duì)數(shù)據(jù)的理論前提有所忽視,又或者把相關(guān)和因果相互混淆,進(jìn)而致使決策出現(xiàn)失誤的經(jīng)歷呢?歡迎在評(píng)論區(qū)域分享您的看法喲。
