(題字:北京市書法家協會理事,北京市豐臺區書法家協會主席團成員、副秘書長,民盟中央教育委員會委員韓國強)
王士博 | 中國人民公安大學訴訟法學博士生,研究方向:刑事訴訟法學、證據法學。
本文曾在天津市法學會訴訟法學分會與靖予霖天津律師事務所合辦的2021年年會征文中獲獎。發表于最新一期《證據科學》(2022年第4期)。感謝王同學授權“司法蘭亭會”新媒體推介。
【摘 要】算法顛覆了傳統要件事實的單一人工認定模式。算法參數根據構成要件來搭建,海量數據集作為證據的“此岸”通過算法證明到達要件事實的“彼岸”,因此算法是一種技術證明方法。
但算法證明并非適用全部犯罪形態,法定犯因其行為規范的強結構化、行為證據的電子數據化及事實認定的“形式化”,便于算法證明的框架建構。
自方法論意義而言,算法證明的本質是利用數學統計方法解決證據推論問題。算法證明方法與印證并無沖突,算法證明方法具有證明過程的進階性、證明方向的一致性的特征,是權力主導型證明結構,因此算法證明與印證證明是包含關系。
鑒于此,基于法官既有的規范依賴型事實認知模式,應當建立算法的技術標準以解決證明領域的算法解釋黑箱。
2017年國務院發布《新一代人工智能發展規劃》,將發展人工智能作為國家戰略。我國各級審判機關積極探索人工智能與司法裁判的深度融合,實踐的積極探索為學術探討提供了靶向。就理論界討論的具體內容而言,大致包括以下幾個方面:
第一,人工智能司法決策的定位問題。對此,學界已達成基本共識,司法人工智能只能輔助法官改善司法產品的品質,而不能取代以理性與情感為判斷基礎的法官。基于此,在理念上,面對經由算法的司法決策,提出建構算法正義,完成算法司法決策的價值填補。在實體上,人工智能注入司法領域,針對隨之而來的算法歧視、算法黑箱等問題,建立算法監督專員,完善歸責制度。
第二,構建人工智能推理模型。人工智能推理模型可分為法律推理與證據推理。學界對此問題的討論基本采用符號主義的路徑,在元理論層面建構法律領域的推理與人工智能的溝通方式。
第三,聚焦于人工智能技術給刑事證據體系帶來的變革。基于算法分析海量電子數據生成的結論,有學者提出大數據證據概念,并論證了大數據證據具有獨立證據類型的意義,以及對事實認定的影響。
總體來看,司法場景中人工智能不僅在最基礎的層面上提供支持性技術,還可部分代替傳統由法官完成的司法決策。但大部分論者仍立足于法學領域對人工智能“指手畫腳”,這種“設想”式的討論,缺少對算法具體運行程式和算法能力邊界的把握,即算法作為工具本身的不能,導致其論證如墮煙海。
實際上,算法在法學場景中的應用主體是專家系統算法,即基于專家經驗和法律規定構建算法規則。不論是司法決策、推理模型或者大數據證據,從輸入端的要素數據到最終輸出的結構化數據,其分析程序都依賴于確定性的規則和邏輯。若應用基于數據經驗的機器學習算法,則意味著放棄了對分析程序的人工干預,動搖了司法的程序價值根基。從目前刑事司法實踐來看,機器學習算法主要應用于偵查前端的線索篩查以及同一性鑒定中特征初步篩選。
基于上述學術研究現狀,本文將算法介入司法具象化到證明場景。司法裁判包括定罪(事實認定和法律適用)與量刑,目前實踐中的“共治”集中于量刑領域,如上海高院的“206系統”中量刑參考、美國的COMPAS系統等。但算法能否適用定罪?事實認定作為定罪的基礎,強調證據組合的結構化與邏輯性。而就算法技術本身來說,在輸入端,必須將欲分析的事物進行特征化、數據化描述。同時,算法證明是在輸出端輸出待證事實,因此構成要件需可轉換為規則代碼。算法輸入端與輸出端的要求決定了其在事實認定中應用范圍的有限性。
加羅法洛以道德悖反和規范違反為標準區分了自然犯與法定犯兩種犯罪形態。自然犯因其具有倫理非難性而需要實質性的價值判斷,而價值判斷一直是人工智能領域難以攻克的技術難題。自然犯事實認定所需要的知識庫難以被形式化為計算機語言。
相比之下,法定犯的入罪基礎是規范違反,其本質是為了行政管理的需要。法定犯的認定是犯罪行為與規范事實進行匹配的形式性判斷,價值判斷較少,這與人工智能技術的平面化、形式化特征相契合。
在現代刑法中,法定犯主要是經濟犯罪。并且在實踐中,算法證明主要應用于經濟犯罪案件。資金流在經濟犯罪中是偵查的重點,而銀行賬戶交易記錄呈現出海量化、同質化的特點,需要將海量的資金交易數據進行結構化聚合,揭示其中的數據規律,僅憑傳統的印證證明方法難以條分縷析地對其進行組合、推理。通過算法刻畫資金交易數據的規律,從而完成證明。
實踐中偵查機關已經開始使用算法證明案件事實。如在胡某組織、領導傳銷活動罪一案中,常德市公安局對傳銷網站后臺數據庫進行分析,出具的電子數據檢驗分析報告為:胡某注冊賬號總數120……賬號下發展會員人數2434,推薦會員賬號RM10×××05,所處層級10,下線層數75。
該分析報告證明了兩個待證事實:犯罪嫌疑人發展的會員人數和傳銷層級數。不難看出,實踐中算法證明聚焦于次終待證事實,即最終待證事實的要素事實,而非通過分析整個案件的證據推理出最終待證事實。
鑒于此,本文無意建構司法裁判人工智能化的宏大圖景,而是聚焦于事實認定的場域,基于法定犯的規則結構與證據的高度數據化,其與算法具有較高的契合度,將算法在法定犯事實認定中的作用明確為證明方法,其與印證證明是包含關系。立足于法官既有的規范依賴證明模式,提出構建司法證明領域的算法標準的規制路徑。
二、法定犯證明方法可算法化的現實基礎
摒棄算法應用司法裁判的“全能論”,轉向證明部分要件事實的要素式算法建構,需基于算法的技術特性與法定犯證明之中尋求共治的基礎。
(一)構成要件行為的可模型化
虛擬空間中犯罪行為以數字形式存儲,海量電子數據呈現出離散化、同質化、低價值密度的特點,需以整體性數據所凝練的規律性認識來證明待證事實。盡管具有不可直觀性,但是其依然符合構成要件行為的類型化。
因此,法定犯構成要件行為的可模型化成為算法證明的關鍵,其涉及兩個理論前提:一方面是法定犯具有穩定且具體的行為結構。法定犯中的“法”指的是行政法規,其基本犯罪結構可以公式化為行政違法+加重犯(情節加重或結果加重)。行政法規作為前置性法律文件,法官的司法認定依賴其對違法事實構成要件的規定。
行政違法行為在總體上呈現出“行為犯”的特征,大多無需以損害結果的發生為成立要件。從功能上來說,行政處罰主要是對違法行為的懲戒,其所關注的主要不是違法行為已經帶來何種后果,而是將會造成何種后果。
行政違法的構成要件以行為為中心,這決定了其需將違法行為特征詳盡描述,行為特征的組合結構需涇渭分明地區分合法與非法的功能。如組織、領導傳銷活動罪,其前置行政法規《禁止傳銷條例》第7條詳盡規定了傳銷行為的種類,傳銷行為并非是一種自體惡,而是禁止惡,因此其依存于法律創制。
可以說,法定犯證明是一種填補式的“形式”判斷,只要行為符合規范設定的行為類型即可完成。亦即從規范事實的角度而言,其受到來自法定犯的結構制約力較強。這與算法0和1的二值代碼邏輯相契合,便于代碼轉化。
相比之下,自然犯的類型化行為較為抽象。如故意殺人罪,刑法采用簡單罪狀表述為“故意殺人的,處……”。將所有侵犯生命法益的行為抽象為殺人行為,其行為樣態和結構具有多樣性,且對殺人行為的判定是需要倫理經驗的實質判斷。因此無法將其行為結構進行數字化建模。
另一方面是數據分析以算法模型為大前提。與人類分析思維相似,算法的運行也是預設-分析模式,其基本的假設是模式會重復。從算法程序運行的邏輯上來看,算法設計者是將現實世界的邏輯映射到算法模型中。算法模型是數據結構的抽象化模板,是使數據結構化的中心環節。
根據算法模型的生成機制不同,可分為專家系統的規則模型與機器學習模型。機器學習算法模型是一種模型生成自動化工具,可自動學習并構建數據中各種特征的相關關系。機器學習算法所輸出的模型并非準確,其輸出的模型不僅僅造成“黑箱”,而且還會產生錯誤的相關關系。專家系統的規則模型是指借助既定的司法規則、司法經驗,人為構建算法規則。
換言之,專家系統利用專家經驗進行模型搭建,而機器學習是以數據經驗為基礎自動搭建模型。法定犯的類型化危害行為有明確的規定,其特征也相應地具有法律規定性,這就要求算法模型中的規則必須透明并與法律規定相一致。
因此,法定犯的證明算法,是為了處理個別的、具體的案件產生的行為數據,由專家設定其算法參數及算法邏輯,是一種專家系統規則模型。而機器學習生成的算法模型是“機器自主生成規則”,存在參數之間規則的黑箱,其生成的模型可能與法律規定不符,這違反了罪刑法定原則。
(二)行為證據的電子數據化
網絡時代的到來,創造了一個既依托又超越于物理空間的虛擬空間,形成了物理空間-網絡空間交融互嵌的二元架構。人們通過“指尖行為”和人機交互界面輸入指令,觸發既定的程序規則,完成虛擬空間的數據交換,數據交換形成海量的數據存儲于服務器中。
網絡平臺是人機交互的界面,物理環境下的點擊行為只是輸入指令,其背后是以算法為核心的代碼程序。虛擬空間的指令輸入與算法程序共同完成了刑法評價意義上的行為,不同的指令觸發不同的程序運行結果,任何操作的信息指令必然要依次經歷由系統軟件層、操作系統層,到磁盤存儲設備層的轉移。通過指令輸入輸出結果。
基于指尖行為輸入的指令,網絡平臺(包括網站和APP)設計數據交換的算法規則,算法通過自動處理輸出指令進行數據交換,從而完成不同的指令所設定的程序結果。人類在現實世界的活動得到了前所未有的記錄,這種記錄的粒度(即數據的細化程度,細化程度越高,粒度就越小;細化程度越低,粒度就越大)愈小,頻度在不斷增加,為電子證據的收集提供了極為豐富的數據資源。
從整體角度觀察電子數據所在信息系統,其地位和作用并不是簡單地表現為一個個或者一類類獨立的證據,而是一個“現場”,由信息系統生成和記錄著各類信息,這些信息往往足以重建“過去發生的事情”。
“數據現場”由數據內容、行為信息、系統信息和附屬信息組成。如一條轉賬記錄,除了轉賬時間、金額、賬戶信息等內容信息,還包括行為信息的操作記錄,轉賬指令信息傳輸到銀行服務器所遺留的系統日志、安全日志、數據庫日志等系統運行信息,以及上述信息打包存儲在服務器的創建時間、修改時間、大小等附屬信息。換言之,物理空間的“指尖行為”在虛擬空間通過數據形式被完整的記錄,犯罪行為被完整地刻畫于電子數據之中。
(三)法定犯證明的“形式”化
在自然犯證明中,證據與事實之間的推理需要生活經驗充當大前提。而證據推論所依賴的大前提為一個全真命題的情況是罕見的,通常帶有模糊量詞。
例如英美法系中的經驗“已經在法庭上宣誓的證人很少說謊”,“很少”就是一個模糊量詞。而算法是基于數學邏輯,其具有確定性、邏輯必然性和單調性的特點。算法是以0和1為基礎的二值邏輯,只能以“非此即彼”式運行來消除矛盾因素。
模糊性且不確定性的經驗難以轉化為算法語言。考慮到算法確定性與經驗事實模糊性之間的矛盾,司法人工智能領域演化出基于先例的裁判模型,利用機器學習算法對大量打標簽的裁判文書進行學習,輸出算法模型,以對其他案件進行“裁判”。
此種裁判模型有過擬合和泛化能力差的缺陷,其輸出的裁判結論缺乏創造性的價值判斷,顛覆了裁判生成的正當性基礎。倘若采取此種裁決的技術路徑,“難以再見到像馬伯里訴麥迪遜案件這樣具有時代意義的偉大判決了”。
而法定犯具有明確的行為結構標準,是否符合構成要件的規定通常十分清楚明了,是一種“非此即彼”式的形式判斷。法定犯與自然犯在行為結構強弱的差異,影響著證據推論的邏輯。
法定犯是以規范事實為大前提,而自然犯以經驗概括為大前提,自然犯中經驗概括“必要且危險”,決定著結論的可接受性。法定犯的形式化證據推論為其算法轉化提供了邏輯基礎。
遵守形式的法律標準是司法人員法定義務,若是這種形式性的法律標準與實質的價值判斷之間存在沖突,則通常只能考慮通過量刑階段的從寬處理來解決。無意去評價法條主義下形式性判斷的優劣,但證明的形式性判斷毫無疑問地便于建構算法化規范框架。
三、法定犯算法證明方法的原理
法定犯證明方法的可算法化只是“共治”的基礎,而算法如何證明則是“共治”的路徑。
(一)一個并非不證自明的命題:算法是一種證明方法
在我國臺灣地區以及日本,以證明對象劃分為嚴格證明與自由證明。嚴格證明與自由證明是將證據置于訴訟程序之中,嚴格證明之嚴格性表現在法定證據方法之限制和法定調查程序之限制。
法定證據方法指的是探求證據信息的調查手段,在嚴格證明限制下,必須能夠歸納于五種列舉的證據方法(人證、文書、鑒定、勘驗和被告之自白),才是法定的證據方法,才得據以認定犯罪事實并采為裁判基礎,并無所謂的例外可言。
證據方法是程序與證據結合的產物,是在刑事訴訟程序規則下探知證據信息的方法。因此,探求證據本身承載的信息是證據方法的終點。證據方法有特定的適用主體和場景,即證據方法是法官在審理程序中調查證據之方法,特定證據方法經過法定調查程序之后,方取得證據能力,以作為裁判之基礎。
所謂證明方法,指的是從證據到待證事實這一推論過程所使用的手段,要件事實是證明方法的終點。事實與命題具有同構性,證據事實和待證事實的表達以命題的形式出現。證據到待證事實的證明過程也是證據論證待證事實命題的過程。
論證按照方向的不同分為“證實”與“證偽”,分別是控方與辯方在司法證明活動中需要達成的目標。根據論證的路徑不同,英美主流證據法理論中證明方法可分為:屬于整體主義方法的故事模型理論和屬于原子主義方法的論證方法。
無論何種證明方法,其目的皆為從證據推論出待證事實,其主要價值是作為組織、排序或構建證據并從證據中得出推論的工具。如使用鑒定方法對現場的指紋進行比對,探求指紋本身的信息是識別與認知證據的過程,因此鑒定屬于證據方法的一種。而根據指紋證據推理出犯罪嫌疑人曾在犯罪現場出現,這是證明過程,要證明犯罪嫌疑人實施了犯罪行為這一待證事實,還需將其他證據進行邏輯上的組合。
在觸網犯罪中,數據分析的目的在于判斷行為是否符合刑法規定的構成要件。因此,算法模型作為數據結構化的模板,其構建必須以構成要件特征為依據,將犯罪行為的數據特征模型化。
換言之,算法模型實際上是構成要件的代碼形式。以組織、領導傳銷活動罪為例,其犯罪構成行為特征有:組織者或經營者要求被發展人員發展其他人員,并以發展人員的數量作為計酬返利依據;組織者或經營者要求發展人員繳納費用;形成層級,以下線的銷售額計算上線報酬。與構成要件的行為相對應,其資金數據交易特征有資金匯入特征、資金特征、返利特征,這些數據特征經由數學模型化為算法模型。
由此觀之,在數字場景中,算法模型實際上是數據行為的類型化。通過對構成要件行為特征的代碼轉換,使其由現實世界的法律規則轉變為數字世界的代碼規則,構成要件的行為被重構為0和1的組合。
可見,算法模型本身是按照構成要件行為的“彼岸”來構建,經算法分析而產生的規律,已經跨越了“證據→要件事實”之間的波濤,從電子數據的“此案”到達了構成要件行為的“彼岸”。因此,行為數據經由算法模型分析后,不能稱其結論為一種新型證據材料,而應當是部分要件事實。
(二)算法證明的本質維度:數學統計方法
算法證明方法的實踐價值在于解決觸網犯罪行為證明問題,其方法本質是以數據特征為基礎搭建專家系統模型,運用描述性統計方法挖掘海量電子數據的特征規律。由于個案行為特征不同,海量電子數據所表征的規律各異,因此,篩選數據所使用的參數條件也不同。
基于此,本部分以經濟犯罪案件中對資金交易數據(其他可分析數據包括物流數據、通訊數據以及社會關系數據等)的算法證明過程為例進行論述,大體上分為三個步驟:縮小關鍵賬戶、查找特征金額和可視化關系分析。
與現實空間相對應,虛擬空間的行為主體表現為銀行(或第三方支付平臺)賬戶,賬戶的交易數據表征行為。海量交易數據中混雜著犯罪行為人的賬戶、被害人賬戶、資金池賬戶、即進即出中間賬戶等。其中的交易關系盤根錯節,關鍵是剝絲抽繭地找到行為人的賬戶,進而聚焦于該類賬戶的交易數據進行重點分析。
在經濟犯罪案件中,使用“交易賬戶與對手賬號交易匯總統計”模型,可以根據不同案件行為賬戶的特征進行篩選統計。如在組織、領導傳銷犯罪中,層級越高的犯罪嫌疑人,其賬戶交易的進賬和交易次數越多。因此可依據賬戶的入度和出度縮小賬戶范圍。
在統計出重點嫌疑賬戶后,再根據不同類型犯罪的交易特征金額進行分析。分析金額特征的目的是找到與行為人賬戶有犯罪上下游關系的對手賬戶,對手賬戶的性質可通過金額特征進行鑒別。
各類經濟犯罪因犯罪行為的形態不同在資金交易金額上表現為不同的特征,這種金額特征是由實體法所規定的行為類型化所決定。“類型是建立在一般及特別間的中間高度,它是一種相對具體,一種在事物中的普遍性。”刑法中此罪與彼罪一個外觀性區分標準就是行為,不同的行為類型由于具體的犯罪目的差異而具有異質性,這種質的規定性差異在外觀上表現為特征的差異。
換言之,特征是探求特定犯罪行為本質之后顯露于外的質的區別性。因此,行為特征具有區別此罪與彼罪的標準意義。
而在經濟犯罪中,犯罪行為表征為數據,行為特征表征為數據特征。如非法買賣外匯類案件,行為人賬戶的交易金額特征可能呈現出匯率的整數倍。在組織、領導傳銷活動犯罪中,因上下層級之間存在返利關系,其交易的金額特征可能呈現出固定的比例。可見,不同的案件類型決定了行為特征以及數據特征的差異,因此算法的行為建模是一種具有個案針對性的具體技術方法。
可視化利用圖形形式,對數據進行圖形化轉換。可視化分析與上述統計方法不同,可視化是以賬戶為節點,以交易關系為邊且依據交易頻率(或金額)將邊賦權,形成犯罪網絡關系圖,如偵查機關出具的傳銷人員網絡圖,其可清晰地表示犯罪人員的層級和上下游關系。
當然,上述步驟在實踐中是交替進行的。在可視化分析之后,可能會發現新的犯罪賬戶節點,需再對該賬戶交易數據進行研判分析,最終形成賬戶關系網絡。
在統計學意義上,縮小關鍵賬戶是統計分組,將明顯異常賬戶與其他賬戶分離,再基于金額特征對交易明顯異常賬戶的數據進行統計計算。可見,算法的本質是各種統計分析應用,算法是以數據統計的方式進行證明。
經過上述數據分析后,資金交易的數據特征已經明了,數據特征所對應的類型化犯罪行為也已清晰,并完成了對犯罪人數以及犯罪行為的證明。但這并不意味著完成了最終意義上的證明,由于賬戶交易數據同質化程度極高且來源相同,并不能互為補強證據,而應將其視為一個整體,根據“孤證不能定案”的原則尋求其他證據與之印證。
四、法定犯算法證明方法的法律地位
算法證明方法顛覆了傳統單一人工事實認定模式。討論這種新型證明方法必須要充分考慮現行證明模式并要與之兼容。因此,需探討算法證明方法與印證證明的關系樣態,這也決定著法定犯算法證明方法的法律地位。
(一)算法是進階式論證
案件事實的構建是以單個證據推論形成的“碎片”事實組成。在2012年United States v. Jones案中,美國聯邦最高法院認為長達28天的GPS定位偵查積累了大量零碎行蹤信息,如同將大量馬賽克碎片并在一起呈現完整圖像,認定其構成違法搜索。
馬賽克理論(Mosaic Theory)認為海量單個數據整合行為會對隱私權產生更深層次的侵犯。虛擬空間在形態上表現為數據構建的巨大的信息空間,以數據形式記錄行為痕跡,形成巨大的數據資源池。
從數據池中調取的犯罪行為數據具有零散化的特點,單個數據作為證據所證明的事實過于微觀,以至于其是否具有關聯性無從判斷。如上述案件中Jones從某地到另一地的單一行程軌跡無法證明其涉嫌毒品犯罪,但整合28天行蹤監控軌跡數據,就可以發現其行為規律,并建立起其與涉嫌藏匿毒品地點之間的聯系,從而與案件實現關聯。
但是,軌跡數據僅證明Jones在空間上與藏匿毒品地點具有相關關系,欲證明Jones販賣毒品,還需要Jones和其同伙具有販賣行為等證據。否則,在中國此案很可能只能指控其非法持有毒品。
可見,刑法規范是眾多要件要素的集合,就案件事實的終局性證明而言,電子數據的體量即使再大,也不能形成論證的閉環,算法證明并不是完備的證明,其只能證明部分要件事實,且結論并非是無可辯駁的。
統計方法決定算法證明的結論具有似真性,仍需證明數據行為背后的目的以及現實空間其他類型證據進行印證。自統計學的角度而言,數據規律是量的疊加,量的累積達到何種標準才能做出定性判斷,存在疑問。因此,算法證明方法不是一種終局狀態的證明。欲完成全局性證明,還需要其他證據通過印證證明方法進行證明。
與之相同的是,印證在量上的要求是“孤證不能定案”,印證本身就體現出兩個以上證據之間的相互關系。印證憑借證據信息和指向的同一形成完整的證據鏈條,其核心要義在于證明意蘊的疊加,相互印證的證據數量越多,印證的可信度就越高,因此,印證注重的也是過程狀態,并不強調完成狀態。
(二)算法證明方法中包含“一致性”要求
自算法證明機理觀之,在算法證明中,算法模型運用各種數據參數來建構一個標準的、并符合算法設計者預期的完美“主體”形象,將完美的主體形象用以評價真實的個體,這個由算法模型生成的完美的主體形象實則成為評價個體的基本參照系。
而這個基本參照系是否完美,決定著證明結論是否準確。算法證明關注證據信息間的相關性,即電子證據信息間的數值關系。而這種量化的相關關系背后,是以數學方程模型進行支撐。數學公式模型必須與欲論證的命題邏輯相洽。
在數學方程模型中,邏輯方向一致性體現為數據的擬合性。如上述組織、領導傳銷活動罪中,倘若海量數據沒有呈現出規律性,其與數學模型欠擬合,必然呈現出不規則的點狀離散狀態。
因此,海量數據中的每一單個數據都不是“無辜”的,都為規律性貢獻了力量。當海量數據經過算法模型得出規律性結論,其與構成要件行為特征相符,即完成了證明。換言之,以規律性認識發揮證明作用,需判斷點狀數據是否擬合數學模型,進而可判斷數據規律是否符合構成要件行為特征。
印證證明方法所蘊含的證據信息一致性內容,實際上是真理融貫論在證據方法的體現。融貫論的基本觀點是系統內部的協調一致性與無矛盾性。海量數據經由算法模型分析所得出的規律性認識,同樣具有證明方向一致的特征。
但稍有不同的是,海量數據并非完全擬合數學方程模型,而是有一定的離群值。離群值影響海量數據擬合數學方程的優度。質言之,當離群值較多時,海量數據可能不符合規范行為規律。
鑒于此種情況,應當結合其他證據探求離群值的原因。如果沒有其他證據印證,則犯罪嫌疑人可能不構成犯罪。當離群值較少時,一般不影響規律性認識,可對其剔除或忽略。
(三)算法證明與印證同屬“權力主導型”證明結構
在事實認定方面,訴訟中存在控訴、抗辯證明和裁判者心證三個證明系統。法庭上的證明過程應當是辯證的、動態的,基本的辯證情景要求存在對立的觀點以及對這些觀點的批判性檢驗。
但在我國司法實踐中,裁判者心證系統受到控訴證明系統影響最為深刻,其往往與控訴證明系統形成重合,拒斥抗辯證明系統。表現在裁判結果上為支持控方的有罪指控,對辯方意見不予采納。
控訴證明系統對裁判者心證系統的影響也體現在證明方法上。證明強調的是控辯雙方論證各自提出命題的過程,證明方法是論證這一命題的手段方法,控方使用的證明路徑稱為印證證明方法。而面向法官這一主體,法官并非證明的主體,法官使用印證方法應當稱為印證裁判機制。
這種控方與裁判者使用同一證據推論方法的“權力主導型”證明結構,不同于圖爾敏論證模型與威格摩爾圖示法向辯方信息開放,其抗拒辯方信息的介入,表現為法官對控方所證明的事實予以認可。
實踐中,裁判者心證系統對算法證明結論的接納,為算法證明同屬于權力主導型證明結構提供了注腳。如在陳某組織、領導傳銷活動一案中,針對辯護人提出的“電子數據檢驗分析報告中涉及的層級及發展的會員人數存在疑問”“應當由具有相應鑒定資質的機構出具鑒定意見”辯護意見,法官認為“電子數據檢驗報告是對數據庫提取的電子數據進行檢驗和分析后得出,應當作為認定本案事實的依據”。
可見,盡管缺乏技術知識背景,但法官仍認定了算法證明生成的事實,控方使用的算法證明方法影響法官的心證,算法證明的事實被裁判者納入到最終待證事實之中。
總之,算法證明方法中所蘊含的進階式、一致性內涵與印證證明方法高度契合。另外,算法證明方法適用于法定犯中行為要件的證明,其證明的是部分事實要素,而最終待證事實的構建仍需證據之間印證。基于此,算法證明方法是印證證明的技術補充,其屬于印證證明下階的具體證明方法之一。
五、法定犯算法證明方法的規制
與印證證明不同的是,算法證明將計算機技術融入司法證明之中。而算法的穩健性、魯棒性決定事實認定結論的準確性。此外,裁判說理需要算法具有可解釋性,因此有必要對作為證明方法的算法進行規制。
(一)證明的新憂宿疾:技術黑箱與心證黑箱的互嵌
傳統自由心證推崇裁判者“聆聽內心的聲音”,法律決策終結于“內在的感覺”,最佳的理性就是“源自內心最底層的呼喚”,秘密心證成為裁判者抵御追問與質疑的遁甲和解脫壓力與責任的利器。
現代自由心證強調對心證的規制,講求心證公開。對社會公眾來說,了解法律的溫度是通過一個個生動的案例,而非刻板靜態的法條。對辯方來說,心證公開是其程序性權利和實體權利的保障,也是當事人信服與接納判決結果之法理基礎。
2009年12月最高人民法院發布《關于司法公開的六項規定》第五項規定:“裁判文書應當充分表述當事人的訴辯意見、證據的采信理由、事實的認定、適用法律的推理與解釋過程,做到說理公開。”但在實踐中,裁判文書一般只列出證據的內容而不對其進行解釋和評價。
自法官的認知機制而言,其認知過程包含經驗直覺與理性分析。法官所掌握的法律專業知識與經驗是直覺加工系統的基礎,這種加工機制是跳躍地、自動化地進行,個體不能明確表述自己獲得結論的過程和方法,并伴有情緒反應。
可以說,法官在庭審過程中因庭審時間有限,更多地運用直覺機制。而在撰寫判決書時,法官會對在庭審中由直覺機制形成的心證進行回溯性檢驗,因而在這個過程中更多地運用理性分析機制。但經由直覺機制形成心證的整個過程中包含大量“法感”難以言明,并不能充分地形諸文字。
此外,裁判文書公開使得外部的社會監督加強。為了規避類似彭宇案判決書說理的風險,法官刻意地將判決書說理部分簡化,隱藏其心證形成過程。而列入副卷的“審理報告”“審結報告”以及審委會會議紀要卻有相對詳細的裁判理由,但其并不對社會公開。質言之,裁判者的心證公開“內外有別”。
前波未滅后波生,算法證明形成的技術黑箱不僅對于法官來說不能理解,辯方及社會公眾更是不明所以。實踐中法官盡管接納了算法證明的事實結論,但并不具備專業知識對算法證明的事實進行審查。
算法證明形成了一個技術黑箱,算法證明的事實部分成為不可探明之灰色地帶。因此,在判決書中呈現出算法黑箱與心證黑箱疊加的狀態。
(二)法官對法庭科技的認知圖景:規范依賴
從具體的算法規制路徑上,很多學者以理解算法的內部運行邏輯的角度出發提出規制措施,如設定算法解釋權利或算法解釋義務。這從保護被告人的權利角度而言無可厚非,但是從法官事實認知模式的角度來說,法官缺乏算法專業知識背景,上述算法解釋的規制路徑無法解決“技術無知”的困境。
在傳統事實認知模式下,法官運用經驗和邏輯,憑借感官對證據信息的察覺,對原生性證據所承載的信息進行邏輯推演。但實踐中法官往往表達這樣一種觀點:希望證據立法能夠細密、完備,特別希望其中能夠詳細規定各種證據的證明力及其判斷方式,使法官在辦案時能夠有一個明確的指導。
而隨著科學技術涌入證據領域,科技所代表的技術理性替代了日漸式微的經驗與邏輯,科學技術完成了對法庭事實認知模式的“技術占領”。而法律專家不可能是每個領域的專家,但他必須得是真正的法律專家才行,這樣才能在法律的基礎上甄別其他專家的同行意見,然后作出法律上的妥當決定。
于是,“法官是法庭的國王”這一傳統共識也被打破,技術專家成為與法官分庭抗禮的角色。大多數科學技術都具有自身的缺陷和風險,而法官需要審查的不是出現在法庭上的科技是否是完美的,而是如何評估一個不完美的研究,從不完美的知識中進行事實認定。
司法程序并不是一個無限追求實質真實的場域,若要求法官通過掌握相應的科學知識審查算法,在實踐層面無法實現。法官面對專業知識的無力使我們面對這個問題時似乎束手無策。
但從實踐來看,法官對專業知識的認知往往設定一個“錨點”。美國科學證據的可采性標準中的Frey標準以及Daubert標準將法官的認知錨定在科學原理的“同行普遍接受”“是否可檢驗”“檢驗的錯誤率如何”等標準之上。而中國法官對鑒定意見的采信錨定在替代性審查機制上。可見,法官在面對科學技術時往往規避“外行審查內行”的局面,而是依賴于技術法律規范以認定事實。
鑒于實踐中對事實認定規則的依賴和算法技術的專業性壁壘,尋找替代性測度機制成為審查算法證明結論的良方妙藥。將法官審查算法的壓力傳導給技術性規范,法官只需要在法庭上做出形式審查即可。因此,可將算法規制的節點提前,即設置作為證明方法的算法規范標準,消弭法官對算法證明結論的審查困境。
(三)算法證明的替代性審查路徑:算法標準
法律與科技的關系是一個持久的話題,法律在應對單一功能的技術時,往往在事前設定技術和質量標準,并在事后通過落實侵權責任進行損害賠償救濟。技術的標準并非在技術應用的初期設定,而是實踐中經驗和教訓的總結,是技術細節凝練之后的產物。因此,技術標準的制定具有滯后性。
實際上,技術標準正成為踐行算法規制的重要場所。如中央人民銀行發布的《人工智能算法金融應用評價規范》對金融場景下的算法設定了算法標準。在警企合作的大背景下,各地偵查機關使用的軟件算法大相徑庭,這會導致算法證明結論的差異,進而對證明結論的準確造成影響。
證據場景下,算法的科學性就體現在其標準化程度,標準化為法官審查算法提供了基點,消解了法官算法知識不足與算法證明結論之間的緊張關系,符合“將專業的事情交給專業的人做”的分工機制。法官通過對算法的形式審查是否符合算法標準來認可算法證明的結論。
如果算法的應用沒有標準化,那么證明場景中算法準入門檻、算法的升級迭代會變成沒有限制的無序發展。同時,司法算法標準化能夠克減算法技術的資本色彩,提供技術支撐的企業所具有的私利性與司法證明所具有的公共性之間的矛盾得以緩和。
更重要的是,設定司法算法的標準能夠對算法進行解釋,可以防止法庭審判因過分糾結技術而拖延。算法解釋源自對算法運行邏輯的不信任,算法技術所產生的黑箱更是對以公開透明為目標的社會運行形態的悖反。
美國學者研究發現,人們對算法普遍具有一種“算法厭惡”(Algorithm Aversion)的心理。而構建算法信任,需要人們對算法的信任傾向和算法自身的可信度兩個方面。建立司法算法標準是“畢其功于一役”的路徑。
當然,技術的應用一般是“先興起,再治理”,算法標準的制定也應當等待算法技術實踐經驗的沉淀。過于急切地在算法應用的早期制定算法標準,不僅不利于事實的認定,反而有限制證明領域算法的發展之弊端。
從算法標準的制定主體來看,算法的國家標準可以由公安部物證鑒定中心負責制定。由于各地區公安機關合作的企業不同,算法的使用呈現地域性差異。因此,可以制定與細化國家標準的地方標準。
從標準的內容來看,構建算法證明模型分為三個步驟:犯罪行為特征提取、特征轉換數學模型和數學模型代碼化。可以發現,盡管算法標準解決的是僅僅是第三個步驟的問題,但是前兩個步驟決定算法模型可靠、合法的關鍵。
因此,在標準制定前,應當組織由法學和計算機專業的專家、學者以及實務部門的工作人員組成的算法標準化委員會,承擔算法模型構建的前兩個步驟的標準化工作。目前,公安部經濟犯罪偵查局就針對各種經濟犯罪類案件在公安系統內部云系統上傳了算法模型,但是尚未與檢察院、法院共享。建立算法標準時可以借鑒其算法模型。
六、結語
以算法為主導的智能科技已經全面滲透到社會運行的毛細血管之中,證明領域也不例外。法官事實認定的模式也發生了改變,從論證到建模、從經驗到計算,數字與數據已經悄無聲息地占領了裁判場域,重構了法官的認知模式。
算法已經融入社會運行體系的各個領域,算法模型替代人類自動化決策,成為每一個領域無法擺脫的影響性或支配性力量,我們每個人都“困于”算法運行系統中。
在愈發緊張的人機關系中,對算法的規制呼聲不絕。而回應呼聲的解決之道在于建立算法標準。同樣的,證明領域更需要建立算法標準來克減法官因審查算法而帶來的壓力。
國務院在2017年發布的《新一代人工智能發展規劃》中,制定了人工智能發展的戰略目標,即到2025年,初步建立人工智能法律法規、倫理規范和政策體系,形成人工智能安全評估和管控能力。在規制算法時,法律需要汲取技術發展的沉淀,降低算法規制對既有的體系和實踐造成較大的風險。
參考文獻與注釋:
秦漢:《人工智能司法裁判系統的學理反思》,《北方法學》2021年第3期;葛翔:《司法實踐中人工智能運用的現實與前瞻——以上海法院行政案件智能輔助辦案系統為參照》,《華東政法大學學報》2018年第5期。
鄭玉雙:《計算正義:算法與法律之關系的法理建構》,《政治與法律》2021年第11期;蔡星月:《算法正義:一種經由算法的法治》,《北方法學》2021年第2期;宋保振:《智能裁判的價值填補——以法律解釋的認知研究為突破口》,《求是學刊》2021年第2期。
程凡卿:《我國司法人工智能建設的問題與應對》,《東方法學》2018年第3期。
人工智能推理模型的研究可以分為兩種路徑:一種是符號主義路徑,另一種是聯結主義路徑。聯結主義認為人工智能源于仿生學,特別是對人腦模型的研究。它從神經元出發研究神經網絡模型和腦模型,符號主義認為人工智能源于數理邏輯,它試圖在計算機上實現邏輯推演系統。
雷磊:《人工智能時代法律推理的基本模式——基于可廢止邏輯的刻畫》,《比較法研究》2022年第1期;張保生、楊菁:《人工智能法律系統的一種證據推理模型》,《證據科學》2021年第5期。
劉品新:《論大數據證據》,《環球法律評論》2019年第1期;元軼:《證據制度循環演進視角下大數據證據的程序規制——以神示證據為切入》,《政法論壇》2021年第3期;林喜芬:《大數據證據在刑事司法中的運用初探》,《法學論壇》2021年第3期;馬明亮、王士博:《論大數據證據的證明力規則》,《證據科學》2021年第6期。
陳興良:《法定犯的性質和界定》,《中外法學》2020年第6期。
參見湖南省石門縣人民法院(2019)湘0726刑初29號刑事判決書。
張保生、楊菁:《人工智能法律系統的一種證據推理模型》,《證據科學》2021年第5期。
這里討論的行政法規是與刑法中法定犯所對應的行政法規范。并非指整個行政法規。
熊樟林:《行政違法真的不需要危害結果嗎?》,《行政法學研究》2017年第3期。
汪永清:《關于應受行政處罰行為的若干問題》,《中外法學》1994年第2期。
《禁止傳銷條例》第7條:“下列行為,屬于傳銷行為:(一)組織者或者經營者通過發展人員,要求被發展人員發展其他人員加入,對發展的人員以其直接或者間接滾動發展的人員數量為依據計算和給付報酬(包括物質獎勵和其他經濟利益,下同),牟取非法利益的;(二)組織者或者經營者通過發展人員,要求被發展人員交納費用或者以認購商品等方式變相交納費用,取得加入或者發展其他人員加入的資格,牟取非法利益的;(三)組織者或者經營者通過發展人員,要求被發展人員發展其他人員加入,形成上下線關系,并以下線的銷售業績為依據計算和給付上線報酬,牟取非法利益的。”
孫樹光:《論法定犯裁判事實證成中人機協同系統的建構》,《當代法學》2020年第2期。
戴士劍:《電子證據科學性初探》,《湖南大學學報(社會科學報)》2020年第3期。
[美]安德森等著:《證據分析》,張保生等譯,中國人民大學出版社2012年第2版,第129頁。
前引14。
張保生、楊菁:《人工智能法律系統的一種證據推理模型》,《證據科學》2021年第5期。
徐駿:《智慧法院的法理審思》,《法學》2017年第3期。
張保生:《事實認定及其在法律推理中的作用》,《浙江社會科學》2019年第6期。
勞東燕:《法條主義與刑法解釋中的實質判斷——以趙春華持槍為例的分析》,《華東政法大學學報》2017年第6期。
林鈺雄:《嚴格證明與刑事證據》,法律出版社2008年版,第9頁。
同上,第11頁。
張保生:《事實、證據與事實認定》,《中國社會科學》2017年第8期。
前引16,第147頁。
《中華人民共和國刑法》第224條:“組織、領導以推銷商品、提供服務等經營活動為名,要求參加者以繳納費用或者購買商品、服務等方式獲得加入資格,并按照一定順序組成層級,直接或者間接以發展人員的數量作為計酬或者返利依據,引誘、脅迫參加者繼續發展他人參加,騙取財物,擾亂經濟社會秩序的傳銷活動的,處五年以下有期徒刑或者拘役,并處罰金;情節嚴重的,處五年以上有期徒刑,并處罰金。”
在計算機科學領域,在有向圖中,箭頭是具有方向的,從一個頂點指向另一個頂點,每個頂點被指向的箭頭個數,就是它的入度。從這個頂點指出去的箭頭個數,就是它的出度。此處的入度指的是賬戶收入交易次數,出度指的是賬戶支出交易次數。
因現實空間的行為人可能對應虛擬空間多個交易賬戶,在實踐中,行為人為了逃避偵查,有買賣“人頭賬戶”的情況,需要對賬戶的所有人及其關聯人的賬戶合并分析,交易的金額特征需統計行為人控制的賬戶進行合并計算。這是在數據清洗階段解決的問題。
轉引自王鵬飛:《普遍處罰模式下預備行為的類型建構》,《法學雜志》2021年第6期。
牛琨:《縱觀大數據:建模、分析及應用》,北京郵電大學出版社2019年版,第27頁。
[美]羅納德·J·艾倫:《人工智能與司法證明過程:來自形式主義和計算的挑戰》,汪諸豪譯,《證據科學》2020第5期。
United States v. Jones, 565 U.S. 400 (2012).
馬賽克理論是美國法院考慮信息收集、政府透明度以及搜索和扣押等問題的法律學說,特別是在涉及政府實體的侵入性或大規模數據收集的情況下。該理論得名于馬賽克瓷磚藝術:雖然從遠處的馬賽克瓷磚可以看到整幅圖片,但孤立地觀看單個瓷磚不會出現清晰的畫面。馬賽克理論要求執法部門對數據收集進行累積理解,并將搜索“作為一系列步驟而不是單個步驟”進行分析。盡管該學說首先用于涉及國家安全的案件中,但在美國訴瓊斯案中,美國最高法院將其用于判斷個人是否受到非法搜查。See Kerr Orin, The Mosaic Theory of the Fourth Amendment, Michigan Law Review. 111: 311–354(2012).
栗崢:《印證的證明原理與理論塑造》,《中國法學》2019年第1期。
張恩典:《反算法歧視:理論反思與制度建構》,《華中科技大學學報(社會科學版)》2020年第5期。
元軼:《證據制度循環演進視角下大數據證據的程序規制——以神示證據為切入》,《政法論壇》2021年第3期。
龍宗智:《印證證明新探》,《法學研究》2017年第2期。
梁玉霞:《聚焦于法庭的敘事:訴訟證明三元系統對接 論裁判者心證自由的限度》,《中外法學》2011年第6期。
向燕:《論刑事綜合型證明模式及其對印證模式的超越》,《法學研究》2021年第1期。
參見湖南省石門縣人民法院(2015)石刑初字第152號刑事判決書。
蔡星月:《算法正義:一種經由算法的法治》,《北方法學》2021年第2期。
何艷芳:《論心證公開在刑事訴訟中的功能》,《法學雜志》2008年第6期。
周洪波:《比較法視野中的刑事證明方法與程序》,《法學家》2010年第5期。
李安:《司法決定的認知機制與理性約束》,《浙江社會科學》2016年第3期。
解正山:《算法決策規制——以算法“解釋權”為中心》,《現代法學》2020年第1期;許可,朱悅:《算法解釋權:科技與法律的雙重視角》,《蘇州大學學報(哲學社會科學版)》2020年第2期。
李訓虎:《證明力規則檢討》,《法學研究》2010年第2期。
陳景輝:《人工智能的法律挑戰:應該從哪里開始?》,《比較法研究》2018年第5期。
Beecher-Monas Erica, Evaluating scientific evidence: an interdisciplinary framework for intellectual due process, Cambridge University Press, 2007,p.2.
對鑒定意見的審查,一是形式上審查鑒定意見是否符合相應的技術規范,《司法鑒定程序通則》第22條規定了鑒定的技術標準和技術規范采用的順位。二是將鑒定意見的實質審查轉化為法律程序問題,審查遵守程序規則的相關程序證據是否具備。《司法鑒定程序通則》第23條規定:“鑒定人對鑒定過程進行實時記錄并簽名,記錄可以采取筆記、錄音、錄像、拍照等方式。”三是強制鑒定人提出可靠的鑒定意見。制定了《司法鑒定機構登記管理辦法》、《公安機關鑒定機構登記管理辦法》以及《司法鑒定人登記管理辦法》等,鑒定意見的可靠性很大程度依賴鑒定人的可靠性。全國人民代表大會常務委員會于2015年4月修改的《關于司法鑒定管理問題的決定》中規定了鑒定人的追責機制。由此觀之,有關鑒定的方法、鑒定標準以及科學原理等問題已經納入到了國家的鑒定管理體制之中,從而在審判程序之前在很大程度上已經解決了鑒定意見科學性的評判標準問題。
胡凌:《理解技術規制的一般模式:以腦機接口為例》,《東方法學》2021年第4期。
《人工智能算法金融應用評價規范》第6部分是安全性評價,其中包括對目標函數、算法可追溯性、算法內控等設定標準。第7部分是可解釋性評價,從可解釋性評價維度、建模準備、過程、應用全流程進行規范。第8、9部分是對人工智能的評價標準。
對這種現象的一種解釋是,盡管有證據表明它們更準確,但人們往往錯誤地認為算法不太準確,。Dietvorst等人證明了這種解釋背后的機制:人們對算法的錯誤表現出比對人類更大的不容忍。如果人們看到一個算法出錯,他們會認為這個算法是有缺陷的。當他們看到一個人類的錯誤,他們愿意再給它一次機會,相信他或她會學習。此外,Yeomans等人發現了一種不同的算法厭惡的驅動因素:人們對算法的不信任可能源于對它們如何工作缺乏理解。See Lowens Ethan, Accuracy Is Not Enough: The Task Mismatch Explanation Of Algorithm Aversion And Its Policy Implications, 34Harvard Journal of Law & Technology258, 261-263(2020).
轉引自袁康:《可信算法的法律規制》,《東方法學》2021年第3期。
這也是該機構的主要職責。如電子數據的三個國家技術標準:GB/T29360-2012《電子物證數據恢復檢驗規程》、GB/T29361-2012《電子物證文件一致性檢驗規程》、GB/T29362-2012《電子物證數據搜索檢驗規程》都是由公安部物證鑒定中心制定。