摘 要:理論生態學研究面臨對野外實驗和原假說顯著性驗證的質疑。前者可通過公眾參與異質性研究予以消解;分析了原假說顯著性驗證后,認為可將后者改為多輪驗證,由此保持假說-演繹方法的有效。根據生態學特點和原假說顯著性驗證要求,進一步修正了普拉特的強推理邏輯步驟并指出生態學進步模式為不同于精致證偽主義與波普爾強證偽主義的第三種證偽主義——弱證偽主義。
李際, 自然辯證法通訊 發表時間:2021-08-24
關鍵詞:假說-演繹 科學說明 原假說顯著性驗證
一、生態學野外實驗與NHST引發的質疑
《證偽主義的生態學假說判決性實驗辯護》以證偽主義立場批判了奎寧(F. Quinn)和杜漢(A. E. Dunham)的觀點。該批判主張生態過程并非都是多因子機制的,并堅持生態學野外實驗可反映假說演繹的強推理邏輯而存在判決性實驗的可能。[1]
野外實驗已成為理論生態學(以下簡稱“生態學”)重要的研究方法之一,尤其是全球空間尺度的長期野外實驗研究正迅速發展。[2] 迄今,生態學家們發展出了全球野外實驗網絡,甚至進行了方法總結,提出了協同分布式實驗(coordinated distributed experiments, CDE)和分布協作式實驗(distributed collaborative experiments,DCE)。[3]-[4] 但有限的站點使得對實驗結果是否具有統計學意義產生了爭議。[5]-[8] 這意味著即使在全球范圍進行野外實驗,其結果可復制性(replication)并未得到認可,即目前生態學野外實驗方法還不可靠。①
另一方面,生態學實驗數據的主流統計方法采納了基于假說-演繹邏輯的原假說顯著性檢驗(null hypothesis significance test, 簡 稱“NHST”)。但自NHST方法誕生以來,關于它的爭議始終存在,并愈演愈烈視。研究表明,“大部分物理科學研究者認為NHST的可靠性是不科學的”,它存在 “導致針對原假說高度的證據誤導”而過于武斷的拒絕原假說。[9]-[11] 2010年,《科學》(Science)的新聞版發表了《這是科學最骯臟的秘密:通過站在脆弱基礎上的統計學分析去驗證假說的“科學方法”》,一周后的《自然》(Nature)刊發了《科學方法:統計錯誤》,該文成為當時《自然》被最多次瀏覽的文章。[12] 對于NHST的最有影響的批判來自于《基礎和應用社會心理學》 (Basic and Applied Social Psychology,BASP)主編們發表的社論(editorial),宣布該刊已開始正式禁止(ban)采用NHSTP 的論文。[13]
若現有生態學野外實驗和NHST都存在重大弊病,則生態學可能就不存在判決性實驗。作為兩者論證邏輯來源的假說 - 演繹邏輯受到了挑戰,證偽主義立場也需質疑。《證偽主義的生態學假說判決性實驗辯護》的基本結論也就不成立。
二、野外實驗的邏輯困難與方法克服
生態學的研究對象和基本科學問題使得野外研究在生態學中的難度相較于生物學和物理學都顯著增加。
生物學的野外研究的傳統方法是野外觀察。通過肉眼或簡單儀器輔助,它描述個體以上生態層次(ecological hierarchy)可見的變化(比如:植物分布和形態研究、物種遷徙與捕食者-競爭關系觀察),記錄下生態過程演化的事件,實驗者對于生物學過程并不進行干預,所以較易。古希臘時代就誕生了自然志(natural history)傳統,近代的生物地理學和生物學都沿襲了這個傳統。當代的公眾科學也在生物學野外觀察研究中清晰的體現了操作的簡便與結論的堅實。[14] 但它仍舊是描述性的科學研究,并未完全進入以精確計量和實驗為特征的現代科學階段。生態學野外研究的主要方法是受控的實驗。它與實驗室實驗最大的直觀區別是實驗環境和實驗室實驗產生了變化——實驗者面對更為廣闊和開放的實驗環境。它最大程度擬合了真實世界中的演變,邏輯上結果更為可信且結論更為可靠。作為現代科學的研究方法,實驗方法使得生態學野外研究優于野外觀察,但對研究者的能力與條件提出了更高的要求——尤其在生理生態學和分子生態學領域。但這還是技術制約,邏輯上并不構成問題。
同為實驗方法,生態學野外實驗具有物理學實驗室實驗所沒有的挑戰。這種挑戰來自于生態學的定義——研究動物和植物與它們的無機和有機環境之間的全部關系的科學,是對達爾文所稱的生存競爭條件的那種復雜的相互關系的研究”。 [15] 野外實驗的目的是找出處于生態過程演化中的生態因子(ecological factor)之間的相互作用(interaction,生態學術語,本文中的含義等同于因果關系或因果機制)。而生態過程同時存在單因子、雙因子或多因子三種情況。這與物理學對因果機制的理解形成了差異。自古希臘開始的自然哲學傳統以及當代粒子物理學都是單因子假設的,它在找尋基本粒子;牛頓力學是雙因子假設的,比如第二定理的因子就是加速度與質量;當代量子力學是雙因子假設的,它認為兩個量子尺度的事物存在瞬間的超遠距離作用的量子糾纏;但,未見物理學有超過兩個因子的多因子假設。這恰好是生態學與物理學的基本假設的顯著差異,也構成了野外實驗的困難。生態學面對的影響因子往往超過兩個,比如:很多生態學野外實驗要考慮的外部影響因子至少包括氣壓、濕度和溫度等。若對描述種群數量與物種豐富度相互關系的駝峰模型(hump-back model,HBM)分別在年中的南半球和北半球分別展開實驗的話,則可能因為溫度導致個體繁殖的差異而引發不同的結果和結論。兩個實驗的對象(生物個體以及種群)的生物學構成是同質的,形態學上也是同構的,兩個實驗對象本質上是同一的;實驗操作是同時同步的;但,結果并不同一。生態學采納任何一個結果都會導致對生態過程同質性的質疑,這種質疑進一步引發了生態學理論是否可能統一(即各種生態學理論是否可以最終歸納為一般性理論)的疑問。[16] 野外實驗要模擬真實的生態過程,所以不能像物理學那樣只保留一個影響因子而研究該因子導致的因果機制。這個邏輯困難可能是生態學研究目的和野外實驗獨有的。此外,外部影響因子彼此之間也存在著相互作用。比如:由于存在溫度與濕度、海拔與含氧量、營養成分 / 水分 / 光照等多個相互關系的交錯,年中在南半球的澳洲沙漠的實驗結果與年中的北半球的阿爾卑斯山頂的實驗結果可能差異更大——它進一步放大了這種困難,使得生態學野外實驗邏輯困難比物理學實驗或實驗室實驗呈現指數級增加。
歷經了約一個半世紀的發展,生態學研究在引發邏輯困難的同時也在試圖克服困難。它從地理學中借鑒了新的概念,出現了斑塊(patch)、鑲 嵌(mosaic)、 異 質 性(heterogeneity)和景觀(landscape)等概念,它們之間是邏輯遞進的。斑塊很直觀的把生態系統的地理分布看做是在一張大畫布上的不同形的色斑,由于各個不同的斑塊的內部系統構成和相互作用不同構,導致了它們就像是彼此鑲嵌于對方或完整的系統中,呈現出不同質的特性,最后把這種不同質稱之為異質性,并借鑒園林設計的概念而把具有異質性的生態地理拓補系統隱喻為景觀。這種思路認為“自然生態系統 ..... 隨時間以復雜的、有時是不可預測的方式而變化”,并批判“以往把生態過程所處的空間看做是環境的同質性和空間上的隨機分布的基本假定是為了研究的方便和簡化,...... 所有生態系統都在一個廣闊的尺度(scale)范圍內表現出異質性和斑塊鑲嵌的特點,這種斑塊鑲嵌是種群動態、群落結構與穩定、物質循環、能量流動和信息傳遞等發生的基礎。”[17] 異質性研究和景觀生態學從 20世紀80年代開始迅猛發展。我國國家自然科學基金委員會地理學部主任傅伯杰院士的主要研究方向即包括景觀生態學,他還兼任國際地理聯合會副主席,由此可見生態學認識的轉變。
生態學已承認生態過程存在由影響因子導致的不同形、不同構、不同質與不同一。前文的邏輯困難就有望通過體現異質性的實驗研究而消解。此前的野外研究局限于職業生態學家,受限于財務壓力和發表壓力等非科學因素等共同作用,使得他們很難開展更大尺度和更長周期的野外研究而獲得充分的異質性研究結果。[18] 應對這一現實掣肘,有學者提出了將生物學和環境科學中已具有影響的公眾參與野外觀察的公眾科學(citizen science)引入生態學的野外實驗研究。[19] 至此,野外實驗可以通過涉獵所有的異形、異構和異質的景觀而完成相互作用研究。在此基礎上,尋找其中的同一性,促進統一的一般性理論的發現。雖然現實條件還不能認為當前可以完全實現,但已不存在上述的邏輯困難。
三、假說-演繹方法與NHST辯護
科學證明可評價科學知識,它有演繹與歸納兩種經典的評價方法,前者屬于邏輯論證,后者屬于經驗證明。[20] 鑒于生態學還沒有一般性理論的事實,它有時也被看做經驗科學,證據之一就是大量采用歸納方法。比如:實驗結果統計學評價的p值驗證(即統計結果不支持原假說預測的頻率閾值,一般為< = 0.05,低于該閾值則認為假說暫時通過了經驗考察,符合證偽主義的原則)。但歸納邏輯的邏輯缺陷決定了永遠可能出現反例,而生態過程的演化語境(context,為避免社會建構的爭鳴,此處不得理解為“與境”)更凸顯了歸納方法的弊端——邏輯上,只要演化持續,就可能產生新的事件推翻此前所有事件驗證的理論。這意味著歸納邏輯并不能確保任何假說的實驗證實,徹底采用歸納方法會導致無法獲得理論。但實際研究中,生態學家的研究步驟是:(1)提出假說;(2)基于假說設計NHST實驗;(3)開展實驗并獲得結果;(4)用p 值進行結果評價并得出科學結論。
這種步驟是普拉特(J. R. Platt)提出的假說演繹方法在生態學研究中的改版,是生態學最常見的科學說明方法,它其實是歸納與演繹的分步綜合。具體而言,在假說提出與實驗設計階段采用了演繹方法,而在實驗結果評價采用了歸納方法。它的起點是邏輯的,終點是經驗的;它體現了波普爾的證偽主義,即用經驗的結果評價假說;無論基于歸納方法的p值驗證支持(本處采用“支持”一詞,以免誤解為“證實”原則)或證偽了假說,這都是對假說的判決性的實驗結果的科學結論。[1] 假說-演繹方法也是實驗重復性(此處的重復性同時包括p 值驗證同一組實驗的結果可重復與對重復多組實驗的結果可重復兩種情況,詳見本文NHST部分)的邏輯前提。鑒于具有相同機制的生態事件邏輯上會出現同樣的定性結果,通過被稱為“科學的基石(cornerstone)”的結果可重復來最終完成第4步的判決工作。
由于假說 - 演繹方法的起點是邏輯的,后續的說明是基于假說演繹出來的。按照演繹方法原則,前件(假說)為真,后件(結果)必為真。但生態過程的特點使得最初的假說為真的可能性被質疑了。事實上,生態學迄今的確也未確立諸如第一原理之類的一般性理論——演化只是它的語境。 所以,前件為真在當前生態學中還未出現。此外,無法判斷未來的演化對當前生態過程的相互作用影響,甚至無法評價假說是更多還是很少的為真。這導致絕對的演繹方法在生態學中是徹底失敗的。因此,該方法是否有效的評價只能通過后續的歸納方法展開。歸納方法原則是后件(結果)為真,則前件(假說)才為真,但仍舊未必永真。其中扮演演繹方法和歸納方法轉換關鍵的是第2步,即 NHST實驗設計。若NHST合理,則該方法才可能邏輯合法。NHST的思路是將兩個邏輯相悖的假說分別作為原假說(H0)和備擇假說(alternative hypothesis)(H1),通過實驗得到的結果,判定其中一個假說不為真,則另一個假說為真的邏輯概率(probability)相應增加。為盡可能確保結論為真的概率,NHST要求以邏輯上為假可能性更大的假說作為H0,當邏輯上為假概率更大的事件在實驗中觀察到了,則說明H0是在更為嚴苛的條件下被驗證,得到的結論比用邏輯上為真概率更大的H1得到實驗驗證的結論更為可靠,即H0得到 NHST的的最嚴格的驗證。[21] 這是證偽主義思路的體現。但生態過程的特點決定實際中實驗達到完全重復幾乎不可能,而假說太易被證偽,以至于沒有理論出現。為此,出現了p值< = 0.05的通用閾值。換言之,對假說的最終判決其實并非直接來自假說或實驗本身。它即非演繹的,也非歸納的;而是來自于統計學的約定,是約定論的。
因對H0采用了嚴苛的標準,NHST的優點是對于原假說的判決標準嚴格,卻的確存在過于草率證偽的可能。但上述批判僅限于有限數量的結果和p值較大的情況下。顯然加大實驗量和提高p 值標準比無法預測的生態過程的演化與異質性相對容易。若加大實驗量并提高p值的要求,即使 NHST采取了經驗的歸納方法使得它不能判決假說是否永真,但可不斷逼近永真。所以,不該就像武斷的否定原假說那樣武斷的拋棄NHST。此時,問題已經不再是關于評價方法的,而是關于現實條件的。鑒于該方法中的前2步的演繹方法在邏輯上是無法徹底滿足的,而真正支撐該方法的是后2 步的歸納方法——只有歸納方法在邏輯上存在逼近永真的可能,所以假說 - 演繹方法應更多的看做是歸納為主的方法。這個結論也符合生態學目前無法擺脫的經驗科學現狀。至于如何避免p值帶來的其他困難,本文不予討論。
四、普拉特(1964)強推理邏輯的步驟修正與證偽主義新理解
普拉特提出假說-演繹方法是基于他的強推理邏輯。起點也是來自于演繹方法的不可靠,即存在前件不充分(或“自明”)的弊病。前文已述,這種弊病在當前生態學的假說-演繹方法使用中也暴露出來了——NHST將假說置于僅存在被支持或未被證偽兩種可能的境遇(醫學統計學中早已存在 NHST第三種結果可能的應用,為簡便表述與不偏離主題,本文不予討論)。處于假說地位的科學理論還未受到嚴格的檢驗,它僅是對已發生的生態事件的因果機制的猜測。由于提出假說時可能未獲得或忽略了相關的證據,提出的假說可能并未完整或正確解釋了生態事件的因果機制。一旦有限的證據對此進行了判決,在實踐中可能導致生態學家集體放棄持續研究的努力——直接證偽假說對于發現真正的因果機制存在負面影響的可能。生態學科學結論的爭議表面上與以NHST方法和p值驗證作為可重復依據的結果一致性,但這些爭議都是采納了一次性的判決性實驗的思路。若對NHST的一次性判決的思路進行修正,有望滿足前件為真的邏輯前提。
普拉特對此是有思考的,并提出了理論上可以窮盡前件的實驗研究步驟:(1)設想(device)各種候選假說;(2)用候選假說設計一個(或多個)判決性實驗,彼此盡可能的相互獨立;(3)開展實驗獲得清晰的實驗結果;(4)如果結果不支持候選假說,則進一步提出并檢驗子假設或提出新的假說,如此往復,直到最終確定的所有假設被證明是正確的。[22] 按照普拉特的本意,假說 - 演繹邏輯并非一定是一次性實驗,而可能存在(對于生態學而言,這是更大的可能)多輪實驗。多輪實驗并非指的是對同一個假說的實驗重復(并非是傳統的可重復性理解),而是對不同假說的分別的實驗——后者才是實驗可重復的前提,前者是實驗不可重復的證據并引發修正后的新假說的下一次判決性實驗。這為化解生態學科學說明困難提供了啟示。
按照現有的NHST,若對一個原假說通過單一的實驗進行判決的統計學結論永遠是0或1(即證偽或未被證偽但不代表確證)。但,只要樣本量足夠大,總會發現不同于假說和常識邏輯的反常事件。在確認實驗操作和統計過程沒有差錯后,它會啟發生態學家修正假說并進行數據驗證或開展新的實驗,如此反復,總是會得到嚴格驗證的一般性理論。因此,他第三步說的不夠明確,應為“開展多個基于同樣實驗協議的實驗獲得清晰的定性(視研究需要,也可為定量)的實驗結果”。此外,基于 NHST,即使采用了多次實驗的思路,每次實驗只能對一個假說(即H0)進行判決,所以第1步的表述應改為“設想一種候選假說(即統計學意義的原假說)”且第2步就不應存在設計多個實驗協議的要求,否則NHST無從判決原假說是否已被證偽或未被證偽。由于僅有1個實驗協議,此時也不存在實驗協議彼此獨立的要求。但,第4步即使結果支持候選假說,仍需補充其他可能的候選假說并重復第2與第3步,如此往復,才能發現生態過程的真實機制且只應該存在一個解釋力最強的最終結論。基于上述統計學和生態學分析,對普拉特的強推理邏輯的步驟做修正后的完整表述應為:(1)設想一種候選假說;(2)用候選假說設計一個判決性實驗;(3)開展多個基于同樣實驗設計(或協議)的實驗獲得清晰的定性(視研究需要,也可為定量)的實驗結果;(4)如果結果不支持候選假說,則進一步提出并檢驗子假設或提出新的假說;如果結果支持候選假說,則設想各種候選假說并逐一完成第2步與第3步,如此往復,直到最終確定一個未被證偽且解釋力最強的假設。
據此,NHST的前件也通過后件的經驗修正最終確保了永真的邏輯要求(此處的永真結論僅限于形式邏輯框架內,并不考慮生態過程持續演化的影響),假說 - 演繹方法的前2步也邏輯合法了。但必須始終記得NHST的原理是即使通過了經驗驗證,也僅僅表明該假說暫時未被證偽,而非該假說正確。這意味著邏輯合法并不等于現實中的完備證偽。因此,生態學家要秉持科學與哲學都堅持的質疑精神,始終對生態過程的因果機制提出其他可能的假說或影響因子,部署新的實驗——只有窮盡了已知的一切知識與可能,才能在當時認為最終通過驗證的假說是可被完全接受的理論。此時,始終被質疑的是各種假說,而非假說 - 演繹方法與NHST。生態過程的演化并不能有效質疑作為方法的假說-演繹與 NHST本身。
修正后的強推理邏輯的步驟仍舊符合普拉特的反復的持續實驗驗證的基本思路,但強化了對推理邏輯與實際操作程序之間的關聯,從經驗的角度為這個邏輯增加了更多的支持,也符合以生態學的研究現狀。這種理解不同于精致證偽主義。精致證偽主義通過保護帶強調了對研究綱領的硬核的維護。這種觀點堅持科學進步模型并非純粹的證偽。本文指出的多輪判決性實驗在步驟上是反復與漸進的,但最終一輪的實驗判決卻是一次性的。此外,生態學還未進入科學說明階段,正在努力發現作為硬核的一般性理論。因此,精致證偽主義不是本研究所認同的生態學進步模式。另一方面,本文強調最終還需進行判決,這與波普爾的證偽主義都采取了較為激進的科學進步模式的立場。但,本文提出的 NHST多輪判決性實驗(非重復實驗)以及對普拉特假說-演繹強推理邏輯的步驟修正比波普爾的證偽主義趨于溫和。本文認為當證據證偽了假說后,可調整子假設或驗證其他的假說,而不是直接拋棄整個體系。比如:當駝峰模型的第一輪實驗結果引發爭議后,研究者并未拋棄該模型,而是繼續提供新的解釋并試圖將爭議引向新的影響因子與相互作用的討論(駝峰模型只是植物種群生態學的一個假說,不應當做精致證偽主義的硬核看待)。[5]-[8]
由此,本文所持的生態學進步模式的立場介于波普爾證偽主義與精致證偽主義之間——完全否定了精致證偽主義但部分否定了波普爾的觀點。若將波普爾的證偽主義稱之為強證偽主義,則本文的立場可稱之為弱證偽主義。
五、結論與討論
應對野外實驗和NHST的質疑,生態學可通過公眾參與的全球野外實驗的異質性研究以及多輪的NHST實驗予以消解并維持假說-演繹方法的有效。普拉特的強推理邏輯步驟應予以修正以為體現生態學特點和NHST的統計學要求。這符合艾莉森(M. A. Ellison) 對NHST適合大尺度生態學研究的觀點——“當我們得出一個科學的概括時,我們并不聲稱這個概括以及它的結果是確定的;我們主張的是它們在我們當時已獲得的知識中有高的概率程度,但這個概率可能被額外的知識所修正。”[23] 如此形成了不同精致證偽主義和波普爾證偽主義的生態學進步模式的證偽主義理解,即弱證偽主義。
但演化的持續使得任何原假說始終處于被證偽的風險,而統計學在生態學研究中僅為手段。“數字是科學討論的起點,而非終點”,無論是生態學還是統計學的方法研究都還會和演化一樣持續。[24] 對生態學發現一般性理論的努力而言,本文的研究可能只是一種西西弗斯式(sisyphusian)的努力。 ①羅夫加登(Roughgarden)曾質疑群落生態學存在一般性理論的可能——“我欣賞建構作為一般性理論的理論群落生態學的呼吁。如果謹慎的睜開眼睛尋找一般性理論,我們能避免(錯誤)投入一般性理論的危險。所以,今天群落生態學有一般性理論嗎?沒有。可能有嗎?是的。應該有嗎?我不知道。”[16] 若考慮演化導致的未來生態過程和事件的不確定,生態學的未來也是不確定性,他的結論迄今未變。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >