>科技>>正文

司法中的人工智能

原标题:司法中的人工智能

artificial intelligence art

标题:司法实践中人工智能运用的现实与前瞻

作者:葛翔,华东政法大学博士研究生,上海市法官

摘要:人工智能已经在司法审判中开始了初期应用,上海于2017年初启动了司法审判人工智能辅助系统的开发。上海法院行政案件智能辅助办案系统前期以政府信息公开案件为基础案由,构建了智能阅卷、智能归纳、智能辅助、庭审评议等模块组成的系统总体架构。在法律人工智能辅助系统开发的同时,我们需要对法律与人工智能的交互关系、人工智能对司法审判决策过程的积极作用,立足于人工智能的技术本质和既有条件进行更为深入的认识。人工智能在改变司法审判过程的直觉主义,推动法律符号系统的完善方面有独特的作用。当然,人工智能进一步在法律领域产生深远影响,仍然需要跨越一些障碍,比如人工智能任务模式、通用性方面的问题。建立法律术语语义网络并完善法律知识库体系,可能是下一步法律人工智能发展的基础。

2017年5月,世界排名第一的柯洁九段与AlphaGo对弈三局,最终以柯洁三局全败终结,这是继2016年AlphaGo以4∶1战胜世界排名第四的韩国棋手李世石九段之后,人工智能在围棋领域所取得的全局性胜利。同样在2017年,微软人工智能程序“小冰”开始“创作”现代诗并被结集出版,又引起了社会的关注。年末著名科学期刊《自然》(Nature)在其官网盘点当年重大科学事件,将AlphaGoZero(AlphaGo的下一代产品)为代表的人工智能以及量子计算机技术忝列其中。

2017年可谓是人工智能的“元年”,从AlphaGo到“小冰”,从无人驾驶到语音智能,人工智能似乎已经进入我们的日常生活。与此相对应,人工智能在专业领域的应用也呈现出日渐蓬勃发展的势头。2017年上海法院全面启动“206工程”——与科大讯飞合作开发的基于人工智能技术应用的刑事智能辅助办案系统——在此基础上,继续构建民事、行政案件智能辅助办案系统。笔者作为行政小组的成员也有幸参与了行政案件辅助系统的开发应用,本文拟从行政案件智能辅助系统(以下简称行政辅助系统)的研发情况出发,探讨一下人工智能在司法实践中应用的现实情况及其愿景,以及司法活动受人工智能交互作用的可能性。

一、初期行政辅助系统的案由应用与现有系统构架

(一)行政案件辅助系统的初期开发案由选定

与刑事案件辅助系统覆盖主要刑事案由不同,鉴于民事案件、行政案件与刑事案件在法律适用、要件构成等方面的差异,民事、行政辅助系统选取了部分案由作为开发初期的切入口。2017年10月,行政辅助系统确定选取政府信息公开案件作为研发案由,开展初期系统构建工作。选择政府信息公开案件作为初期案由样本有以下三点考虑。

  • 请求基础较为简单;
  • 分析样本相对较为丰富;
  • 实践中有迫切的需要;

一方面政府信息公开案件逐年增长,在相关案件中同一性、同类性的情况比较突出,比如行政相对人针对同一行政机关反复提出信息公开申请,或者就同一信息向多个行政机关提出申请等,审判实务中存在一定的重复劳动,也增加了适法不统一、证明标准不统一的审判风险。另一方面,该类案件的非核心工作事务量与案件难易度不相匹配,即使广泛适用简易程序的情况下,由于案件总量较大,仍有待于通过其他途径进一步减轻审判负荷,提升审判效能。

(二)行政辅助系统的基本架构

行政辅助系统基于立案、庭前、庭审、评议、裁判五个常规审理阶段,针对行政案件审理流程提炼为:智能阅卷、智能归纳、智能辅助、庭审评议、文书智能生成五大功能模块。五大功能模块以行政案件审判要件为基础,在审判要件的确立过程中实现智能化辅助,通过相关子模块的设置,结合司法人员的人工选择和辅助系统的智能抽取,共同完成案件待审查内容的固定和完善,进而形成最终的司法判断结果。与五大模块并行的是覆盖全过程的指引类和笔记类板块,主要设置了要件指引、证据审查指引、办案智能笔记、诉讼程序智能提示等功能,以无纸化阅卷为先导,同时配合预先根据法律规范分解形成的要件指引、证据审查标准指引,为审判人员提供必要的规范引导。伴随案件审理的同时,设置了类案推送模块。以下简要介绍各模块的基本构成。

第一,智能阅卷。首先,通过审判专家的知识分析,构建一套完备的政府信息公开案件要素库,为要素标识和抽取提供结构性内容。基于对扫描卷宗的类型区分,分类出图片类卷宗和非图片卷宗,图片类卷宗使用图片分类技术自动识别出身份证、组织机构代码证等类别;对非图片类卷宗通过OCR识别、机器学习等智能技术划分图片标题区域,自动识别出扫描件的标题。其次,在系统后台自动匹配的基础上识别核心卷宗,并根据案件要素库实现对核心卷宗的要素抽取。系统通过词法分析提供分词、词性标注、命名实体识别,继而在卷宗中抽取出要素点,并通过人工修订确保要素信息准确,为后期明确诉讼请求,事实理由、抗辩主张、查明事实预归纳,争议焦点预判断等提供基础要素支撑。

同时,系统对录入的卷宗材料进行区域自定义识别,根据已上传卷宗的材料内容,运用图文识别及分析定制功能辅助审判人员查阅电子卷宗的每一页材料。审判人员在查阅时可对卷宗的重点信息实现自定义信息定位批注,并可随时调用。系统预置了标签资源库,审判人员可选择预置标签,通过对已选择标签和卷宗批注标签资源库的匹配完成重要信息的分类记录,并在后续功能中完成信息回填。

第二,智能归纳。在智能归纳模块中,系统采用“人工标注+机器抽取”的技术实现方式。通过对卷宗信息的文本模块化处理和非文字滤除的拒识技术,根据标准语言理解识别规范的请求路径,实现卷宗信息的智能分析。辅助系统在前端去除异常干扰,并对插入行关键字段进行检测和定位分割后,获得卷宗材料中关于诉讼请求、事实与理由、抗辩主张的相关联字段信息,并对文本内容进行分析解构,以辅助审判人员进行关键信息的归纳梳理及汇集分析。

第三,诉讼费交纳提示。系统通过构建诉讼费缴纳标准、诉讼费缴纳办法指引及诉讼费减免缓指引等数据库,获取诉讼费缴纳情况,便于法官对诉讼费的缓缴、减缴、免缴情况进行复核,复核过程中自动推送减免缓标准提示指引作为参考内容,同时在判决前可以对诉讼费缴纳情况进行智能提示,减少缓缴带来的不便。另外,最终的减免缓解诉讼费结果可自行填充至判决书。

第四,案件受理标准审查。辅助系统构建审查要素数据库,对相关案件的立案条件进行识别。根据行政诉讼法的规定以及实务中不同案由的受理审查标准,调用不同数据库和规则引擎,审查相应内容。

第五,庭审评议。系统支持电子卷宗共享,在合议过程中实时调度电子卷宗库。同时,合议系统通过语音识别,实时转化合议庭成员发言,基于各方的发言,利用语义理解技术,匹配发言过程中涉及的卷宗,实时调度电子证据,并在终端屏幕上同步显示。通过智能系统在合议过程对案件的介绍和主动调阅电子卷宗过程环节,减少纸质卷宗检索带来的不便。

第六,文书智能生成。基于政府信息公开类案件,由业务专家构建标准文书库,通过语义分析技术实现对起诉状、庭审笔录等案件卷宗信息的智能分析和信息提取,提取各类卷宗材料文书所需的核心信息。按照用户选定的文书模板,一键自动生成判决、裁定等法律文书,从而大幅减轻法官手工录入的工作量,并保证法律文书与案件信息的一致性。

第七,类案推送。辅助系统通过对案情描述的理解和语义智能分析,实现对审理报告、庭审笔录、起诉状等电子卷宗和部分证据描述的智能分析;在此基础上结合案件的内容结构,索引致法律规范,实现案件事实和法律要件的融合检索推送,提高类案识别的精准度。同时通过人工智能让机器学习法官的审理思路,把更多有用但是难以归纳整理的案件要素进行分析和理解,找到更加匹配和场景相近的同类案例,并将这样的维度分析开放给法官,让法官可以自由地筛选和过滤所需要的关键信息,获取到用户真正所需的推送案例。

二、人工智能技术在司法中的具体运用——以行政辅助系统为例

根据中国电子技术标准化研究院编写的《人工智能标准化白皮书(2018版)》归纳,目前人工智能标准体系包含:“A基础”“B平台/支撑”“C关键技术”“D产品及服务”“E应用”“F安全/伦理”六个部分。其中关键技术涉及计算机视觉、自然语言处理、人机交互、生物特征识别和VR/AR等。就行政辅助系统而言,其与刑事、民事系统的智能技术应用基础是一致的,整个“206工程”的前提是以诉讼材料的电子扫描为基础,将普通纸质文本转化为可为计算机识别的数字化素材,在此基础上应用图像识别(Image Recongnition)对数字化素材进行识别,其中包含数字图像识别和文字识别两部分。文字识别应用的常规技术即OCR(Optical Character Recognition,光学字符识别),主要处理证据材料中的文字部分,为辅助系统的后续运作提供文本支持。数字图像识别技术则识别证据材料中的非字符部分,如签名、印章、商标图形等,为辅助系统中证据智能比对、校验提供基础信息。

在此基础上,行政辅助系统的主要智能技术应用着重于自然语言处理(NPL, NaturalLanguage Processing),NPL是所有与计算机处理自然语言的相关技术的统称,其目标是通过给计算机配置各类语言知识,使其能够接受人们采用自然语言给它输入的命令,理解自然语言背后所要表达的主观意义,从而实现由一种语言向另一种语言的翻译等功能性目的。在辅助系统中,主要涉及的是两部分:一部分是涉及裁判要件的要素抽取,比如,从原告诉状、被告法定代表人身份证明中抽取原被告身份情况,从被告提交的证据材料中抽取政府信息公开程序中答复的时间、文号,行政复议决定的文号、时间等。辅助系统抽取当事人信息后,可以通过对接其他系统对当事人身份情况进行核验,例如,确定自然人的生存情况、法人组织的存续,被诉行政机关的地域管辖确定等,极大减少人工审查的成本。同时,相关证据的落款时间被抽取后会导入计算器内对政府信息公开程序中的期限进行自动计算,也减轻了法官查明程序性事实的负担。另一部分人工智能技术则涉及自动文本摘要(Automatic Text Summarization),即将原告诉状中的事实理由和被告答辩内容进行摘录,根据预设的判决中“查明事实”部分的话术,对相关证据中所抽取的文本进行摘录重组,回填到“查明事实”话术中,形成辅助系统自动生成的预判事实,为庭审查明内容提供参考。此外辅助系统还会根据庭审笔录中的内容以及辅助系统开发过程中预设的话术,生成案件的争议焦点,为法院裁判提供参考。

辅助系统同时对接庭审模块,运用语音识别(Speech Recognition)技术在开庭的同时同步生成庭审笔录。从目前技术应用来看,语音识别技术已经较为广泛地运用到了全国各地法院审判实践中。

在合议庭评议构成中也可以运用辅助系统的语音识别模块自动转录评议笔录。在智能推送对于法条推送、文书智能推送部分,实际上有行政案件的一些特殊需求。与行政案件相比,民事案件和刑事案件的法律适用是较为统一的,但是行政案件中法律适用是一个棘手的问题,从法律渊源而言行政法包含了从法律到规章各个位阶的法定规范,甚至还要涵盖规章以下其他规范性文件,因此法律检索和发现就成为行政案件审判的重要工作。比如,建设工程规划许可案件中除了《城乡规划法》、地方规划条例以外,在具体规划许可条件中还涉及建筑间距、日照等技术标准和测量要求,虽然由被诉行政行为承担举证责任,但行政诉讼中职权探知原则决定了法官在审理案件过程中必须要承担起法律规范检索的重任。而在一般印象中政府信息公开案件的法律适用似乎是较为单一的,即以《政府信息公开条例》为依据即可作出裁判,但实质上并非如此简单。比如,最高人民法院公布的政府信息公开十大案例中的“姚新金、刘天水诉福建省永泰县国土资源局案”,原告申请公开某区域地块拟建项目的“建设用地项目呈报说明书、农用地、转用方案、补充耕地方案、征收方案、供地方案。”被告答复属于过程性信息不予公开。那么这里既涉及系争的确定“一书四方案”制作机关、制发“一书四方案”的规范依据《土地管理法》《土地管理法实施条例》,也涉及认定“过程性信息”的《国务院办公厅关于做好政府信息依申请公开工作的意见》中对该不确定法律概念的权威解释。可见,即使是在政府信息公开案件中法律规范的检索和适用也不是绝对单一的。此外,政府信息公开案件由于重复申请、同类申请的情形广泛存在,也需要提供必要的类案提示

基于这些考虑,辅助系统中设置了法条推送和类案推送模块,利用现有的裁判数据库和法律数据库,以自然语言理解为基础,以政府信息公开案件中原告信息公开申请的表述作为要素抽取内容,利用复杂特征集(complex feature set)和合一(unification)算法,赋予不同语词在脚本中不同的权重,然后在法律规范场景(scene)和裁判文书场景中进行重构,并选择最优的规范和裁判进行推送。当然,要实现这一功能需要数据挖掘和机器学习的进一步支持。

三、回到理论:实践语境下人工智能与司法审判的可交互性

随着2017年一股“人工智能热”的升腾,法学界对人工智能在法律领域的运用、人工智能的法律地位展开了热烈讨论,有的已经开始讨论强人工智能的犯罪可能性,并提出针对强人工智能的犯罪责任,有必要在刑法中增设删除数据、修改程序、永久销毁等刑罚种类。有的则强调要在刑事审判中为人工智能的应用设定禁区,因为“基于深度学习(Deep Learning)、迁移学习(Transfer Learning)的人工智能,如果应用于刑事司法领域,极有可能自己生成新的裁判规则,改变规则提供主体的性质。也就是说,刑事司法判断,有可能以人工智能提供的裁判规则作为依据。对此,理应设置严格的禁区,防范可能的风险。”这些讨论虽然不乏新意,但是与人工智能的法律实践还是有着较大的距离。就好比儒勒·凡尔纳撰写的《从地球到月球》预言了人类登月一样,虽然美国航天飞船阿波罗号最终实现了人类登月,却并非前者指导的结果。对于人工智能和法律、司法审判的交互关系,笔者从亲身经历行政辅助系统研发的视角,有如下三方面认识。

(一)“想象”的法律——法律文本是语言符号系统的一部分

“符号不但是人类用以认识自己、表征自己存在的工具,而且是人类认识周围事物、相互沟通思想、交流情感的工具。”语言学家索绪尔认为,人的语言本身是一种音义结合的符号系统,语言符号连接的不是客观事物和名称,而是概念和音响形象。后者不是纯粹物理的东西,而是这声音的心理印迹,我们的感觉给我们证明的声音表象。易言之,语言符号本身不是单纯对物质的命名,而是反映了人对物质的主观认知,语言本身是人的思维交换过程的产物,现有脑科学研究也证明语言活动更是人类脑神经活动的产物。同时,语言符号是任意的,能指和所指之间的联系是任意的,作为语言符号系统的一部分,法律的“所指”和“能指”之间的联系也是任意的。清末民初,从1906年《大理院审判编制法》到1910年《法院编制法》都将审判人员称为“推事”,后来一直沿用至国民政府。1949年后我国改称“法官”。[17]无论是法官还是推事,其能指是不同的,但是所指都是相同的,这就反映了法律作为语言符号的典型特征。

语言符号中的能指与所指之间虽然存在联系的任意性,但语言系统本身是一系列声音差别和一系列观念差别的结合,当把一定数目的音响符号和同样多的思想片段相配合就会产生一个价值系统。这种价值意味着语言是组织在声音物质中的思想,这种思想具有社会性——语言作为一种社会符号,不同于其他符号的根本区别在于,语言符号和它所代表的意义之间的关系是通过社会规约所确立起来的,而其他符号则表现为自然的联系或逻辑上的联系。语言符号一旦确立起来,个人则无法改变它,即使是使用它的集体也无法随意地改变它。对于使用它的集体来说,语言似乎是可以自由选择的,但对于这个集体中的个人而言却不是自由选择的。而作为语言符号有机组成部分的法律,同样也是一种“想象的现实”,就比如一家“公司”,组成它的人员是流动的,组成它的财产也是流动的,但是在法律符号系统中这个“公司”仍然是一种恒常概念。法律符号作为人类共同信念维系的,但又与客观所指相对分离的系统,虽然有国家强制力作为后盾以实现其效力,但是这一过程不是实现法律本身,而是法律符号系统的运行结果而已,也就是说我们先构建了法律符号,而后赋予其强制力。

当我们明确了法律的符号学意涵,就决定了法律和自然语言一样是可以被人工智能所处理的。自然语言处理方面的人工智能,其一部分功能本身就是建立于自然语言范式基础上,从乔姆斯基提出生成语法、形式文法开始,就已经构建了自然语言的逻辑基础,为人工智能的自然语言理解提供了理论模型。而法律与自然语言的区别在于,法律的结构性表征更为明显,人工智能技术对法律范式的实现要比自然语言更具备结构化优势。从这个角度来看,如果单纯认为人工智能代替的是法律形式逻辑,将法律要件自动代入推定,实际上那只是开发了一个“计算器”,而不是一种完全意义上的法律人工智能。反之,自然语言理解的人工智能系统也能够经过改造而运用于法律人工智能系统中,两者并不存在必然的界限。从另一个角度而言,法律人工智能的应用还有助于法律符号系统的发展,通过在人工智能系统中引入法律符号,可以使法律符号系统的发展部分具备自我演进的可能性,因为人工智能系统与人脑思维在特定领域是相互独立的,在人工智能系统中运行的法律推理归纳、符号运算等某种程度上也是独立的,人工智能系统也有可能形成新的法律符号系统运算模式,而为人类日常法律应用提供借鉴。

(二)辅助什么?——司法裁判中人工智能运用的法理意义

有的意见提出,人工智能在司法审判中的应用主要在于辅助性,“人工智能可以根据案件类型收集相关证据并对其合法性进行校验,搜索浩繁卷宗并自动提取有效证据内容以防止人工遗漏,自动按照逻辑规则对相关联证据进行排列、分析和比对”。减轻法官的工作负荷当然是开发法律人工智能技术的一个重要因素,但是笔者认为人工智能作为一种“表现出与人类智能(如推理和学习)相关的各种功能的功能单元的能力”,其价值恐怕远超过减轻工作负荷这样的功能预设。这里我们首先要再次确认这样一个事实——法官司法裁判的决策过程也是人的思维的一部分,脱离开这一论据恐怕无法进行后续证明。

2015年世界银行发布年度发展报告《思维、社会与行为》,其中提出人的思维决策过程存在三种模式:自动思维、社会思维和心智模型思维。自动思维意指人在决策过程中往往自动产生决定、判断,而不是通过分析性的思维得出结果。社会思维则指的是人的思维决策具有社会性和趋同性。而心智模型思维则指人的思维受到既定意识结构的影响,心智模型包括范畴、概念、认同、类型、模式、因果陈述和世界观。心智模型本身实际上就是一种“框架”(Frame),为自动思维提供基础。

人的思维决策很大一部分都是自动形成的,而非深思熟虑的产物。这些与司法裁判有什么关系呢?在印象中司法裁判应该是法官在事实与规范之间涵摄、比较、解释的过程,也就是运用推理进行分析后再得出结论。但客观现实是司法裁判很大程度上也是自动思维的产物,通过行为经济学实验发现,即使是法律专业人士也要受到“锚定效应”的影响。在实验中,假设一起侵权赔偿案件,在锚定组里的法官得到的信息是原告的律师要求1000万美元的赔偿。实验人员问两组法官他们会判被告赔偿多少。这个1000万的“锚”明显影响到法官的裁断,控制组的法官判的数额平均值为80.8万,中位数是70万。而锚定组的法官们判的数值的平均数是221万,中位数是100万。甚至于将“锚”更换为骰子随机产生的数,锚定组也仍然受到显著影响。如果说我们原先预想的司法裁判过程是“论证—决策”的话,那么在绝大多数常规案件中实际上恰恰相反,法官的思维过程是先决策再论证。“决策—论证”过程虽仍具备分析因素,但是这部分论证分析是在决策先导的前提下做出的,可能存在证实性偏见,也就是说论证往往是为了加强决策前提,而非否定先导性决策。正如前美国联邦法院法官波斯纳(Richard A. Posner)所述,“法官的根本活动就是快速、连续地作出大量判决,而对决定的合理性和后果缺少反馈。不习惯这一角色的人是不愿成为法官的,或者不愿长期担任法官,或者是不幸福的法官……

由于没有充分的时间,无法等到有客观的、有说服力的论证表明该决定正确时再做出司法决定,因此,法官不会像法学院的学生那样,课堂考试完了之后还会在自己头脑中把考题再过上一遍,法官不愿沉迷在不确定性和后悔之中”。司法裁判中法官的自动思维来自两方面,一方面是先天形成的因素,就如前述锚定效应实验中反映出的一样,这种自动思维模式并非后天习得的,而是进化过程中历史积累的结果;另一方面是“心智模型—框架”带来的影响,法学教育体系、法律经验、法律理论素养、意识形态等等,都会给司法决策的自动产生确立框架和范式。比如于欢案一审判决对于正当防卫的认定,就是“框架”的体现,因为对于正当防卫的判定并不单纯取决于法律规定,而恰恰取决于我们长期以来关于正当防卫的心智框架。

转回到预设的问题,人工智能到底辅助什么?笔者认为,人工智能系统对于司法裁判的辅助功能就在于适当地改变“决策—论证”这样的直觉主义司法过程。在行政辅助系统中证据材料的自动摘要、争议焦点的自动归纳、文书的自动生成、类案推送等等,实质上辅助实现了法官的部分决策功能。在得到人工智能形成的这部分决策结果后,法官的思维“带宽”就集中于论证、分析、研究判断上,人工智能的决策结果为法官提供了重要的参考。从这一点出发对司法审判质量有两方面益处:一是极大地降低了法官直觉判断可能产生的偏差,比如人工智能对案件材料中的内容进行自动摘录后,自动形成争议焦点,或是根据庭审笔录自动生成裁判文书,此时对于法官而言所作的工作是进行复核、分析,对辅助系统得出的决策结果进行解释,而在没有辅助系统的情况下,法官对于常规案件往往直接得出结论,而忽视分析过程;二是在辅助系统帮助下,法官的裁判决策从“决策—论证”恢复到了“论证—决策”的过程,改变了证实性偏见的过程性基础,当我们在没有辅助系统的情况下有时是在论证自我,而当辅助系统提供了决策前提时,我们是在论证他者,从而可以避免了偏见的产生。或许有的意见认为,人工智能不应该代替法官作出决策,但这种担忧是不必要的。因为只要司法过程中的最终判断者是法官,那么就不存在人工智能代替法官作出决断的问题,因为当事人并不是向一台机器询问司法结果,整个司法过程本身就是人参与的过程。或许还有的意见认为,人工智能提供的决策前提也会影响法官的裁判。但是问题来了,没有人工智能的时候,法官也要受到各种非规范性因素的影响,就如前面的锚定效应一样,为何人工智能的影响就一定是不正当的呢?

(三)法律的“想象”——司法过程为人工智能提供“框架”

框架,是一个行为心理学、认知语言学、人工智能学共同使用的术语。在行为心理学中,框架是指决策者在对自己所得信息进行“心理剪辑”和诠释的基础上为自己构筑的解释范畴。在认知语言学中,框架是“知识的特定统一结构,或经验有机的系统化”,作为一种认知结构,为编码为词语的概念所预设的知识。而在人工智能中的框架是指“一种面向数据的知识表示,与具有一系列特征的某一对象相关联,其中每一个特征都存储在称为槽的专用区域内”。人工智能专家明斯基将框架定义为“表征模式化情境的数据结构”。无论是心理学、认知语言学还是人工智能,对于框架定义所反映的本质其实都是一致的,即框架是思维活动中的一种结构,这种结构限定了思维的方式和思维演进的方向。框架为人的思考提供了心理捷径,我们不会每天去仔细思考吃什么、用什么、做什么。比如我们在超市购物时,并不会把超市的每一件商品都查看一遍再最终决定买什么,即使你要买特定的商品,比如要买一盒饼干,你也不会把所有品牌的饼干都看一遍再作决定。你会大致浏览后就作出决定,因为这件商品的外观、形状、内容符合你的思维框架预设。

“框架”也广泛存在于司法过程中,主要表现在两个方面:一方面是以法律术语、法学概念构成的语义网络,即法律思维框架;另一方面是社会伦理道德规范框架。前一范畴是可以模拟的,而后一范畴可能尚无法在计算机中模拟。有句谚语说“法官的早餐影响当天的裁判”,前述笔者也已经提到在直觉主义司法实践过程中,法官的裁判也要受到锚定效应的作用。如何抵抗这种作用?其实我们所受的法学教育就为司法审判提供了一种框架,对锚定效应这类单纯的心理诱因产生互斥的抗衡作用。在某种意义上,司法审判与社会公众的判断之所以存在差异,就是因为法官的裁判产生于既有的法律思维框架,而这是公众所没有的。因此,法律思维框架可以为法律人工智能系统提供参照,即我们按照人类法律推理、法律思维模式、法律概念网络的构成去给定人工智能的运行框架,让人工智能像人类一样对法律进行“想象”。2018年2月人工智能平台LawGeex与斯坦福大学、杜克大学法学院和南加州大学法学教授合作开展了一项人机实验,让20名有经验的律师与AI程序对保密协议中的条款进行识别,在给定法律概念和描述的前提下,由AI和律师分别在5份保密合同中甄别并摘录出相应条款。律师的平均准确率是85%,而AI以94%的准确率胜出,且用时66分钟也远远短于律师使用的平均时间。LawGeex在AI机器学习过程中,让AI创造一种新的法律“语言”模型——将AI算法置于大量的法律文本中,并标识出需要学习的法律概念,而不是仅仅标识出关键词。当AI能够识别法律概念时,也就意味着习得了法律思维的框架。

四、展望未来:法律领域人工智能发展需要突破的一些藩篱

在人工智能蓬勃发展的今天,法律领域的人工智能也呈现雨后春笋般竞相开放的态势。最高人民法院周强院长在2018年3月《最高人民法院工作报告》中也多次提到司法领域中的大数据、人工智能应用。但是法律人工智能系统发展也需要跨越一些障碍,才能真正发挥提升司法质效的功效。

(一)人工智能现有演化进路的限制

早期法律智能辅助系统主要以专家系统的形式呈现,比如1986年国家社科“七五”研究课题《量刑综合平衡与电脑辅助量刑专家系统研究》在建立盗窃罪量刑数学模型方面取得了成果。此外在数据库开发方面,1993年中山大学学生胡钊、周宗毅、汪宏杰等人合作研制了《LOA律师办公自动化系统》。1993年武汉大学法学院赵廷光教授主持开发了《实用刑法专家系统》。但是这些系统如今并没有进入实用化,原因在于这类专家系统根植于既有的法律规范前提,以既有数据归纳为基础,且相对封闭,当我们的法律制度、裁量规范标准变化后,专家系统的逻辑前提就发生了根本性变化,进而无法适用于新的规范环境。而如今依托数据挖掘、深度学习、神经网络算法等人工智能技术新发展,相关系统已经具备开放性发展的特征,但是随之而来的新问题也产生了。首先,法律领域的数据资源开发不足,相关资料的数字化处理也尚不足以较好地支持机器学习的开展。比如通过机器学习可以对微博中的观点句进行识别,并判别相关自然语言中的语义情感。互联网上每天产生的微博数量以亿为单位,但是在法律数据领域中既存在开放度不够的问题,也存在数量级不够的问题,即使以上海全市审判案件数量为基础,对机器学习的数量要求而言也并不一定能足够产生学习效果。其次,机器学习成果的通用性不足。现有的人工智能发展现状是“大数据、小任务”(big data for small task),即基于概率统计构架下的深度学习方法。以前述人工智能自动在微博中识别观点句和语义情感为例,恐怕一个人只需要小学阅读量就可以识别,而计算机的“阅读”量是人的几万倍才能实现同样的功能——当然时间上也是人的几万分之一——而且也只能应用于观点判断,而人的阅读不仅能判断情感,还能获取知识和信息。实际上在行政辅助系统开发过程中,对政府信息公开案由的开发所标识的内容,对于其他案由而言并不必然具有通用性。当进入下一开发阶段后,仍然需要对其他案由文本重新打标签。如何从“大数据、小任务”转变成“小数据、大任务”,需要等待人工智能技术的进一步发展。最后,开发成本与收益之间的不平衡性。由于通用性的不足,有可能造成开发成本高昂和实际应用效果不尽如人意,因此目前辅助系统主攻方向集中于一部分通用性较强的模块,通过部分领域的功能完善来实现人力投入和功能产出之间的均衡性。

(二)建构法律人工智能系统的着力点

从法律人工智能辅助系统的发展方向来看,笔者认为这样几方面工作的开展或许对今后人工智能在法律领域的深度应用有一些帮助。首先是建立和完善法律术语语义网络,目前绝大多数辅助系统中的计算机视觉、语音识别等技术应用实质上都不是法律领域的专有技术,而是人工智能自身发展的副产品。而法律领域人工智能应用今后的主要方向仍然在于法律语言处理和法律语言理解方面。语义网——确定不同字词间的内涵概念关系——的构建是自然语言理解的重要基础,有助于提高自然语言处理的能力。而目前法律术语没有类似的语义网,因此法理学研究中对于法律语言范畴的深入开拓,构建法律语言的结构化研究,进而完善法律术语语义网可能是今后法律语言理解发展的一个方向。其次,完善法律知识库从而帮助法律人工智能独立发展。知识库本身是一种信息库,包含了推理规则以及有关人类在某个领域的经验和专家经验的信息。当然,诸如法信、九章、无讼等法律检索服务机构都在构建自己的法律知识库,但是现有知识库在信息涵摄关系和链接逻辑方面还存在一定的不足,从今后的发展方向来看,需要法律专家根据法律信息的特点挖掘核心信息,打通法律规范、案例事实、裁判要旨、学术观点等内容之间的逻辑节点,并借助人工智能在语义分析、相似度排序、数据挖掘、交互对话等技术,构建一套完整的、通用的、可利用的法律知识库,为法律语言理解、法律人工智能技术迭代打下基础。最后,是对自然语言处理和法律语言处理的机能转换进行研究,法律语言的生成和自然语言生成之间的机制存在一定差异,但也有共同性。解决两者之间的关联性和差异性,或许有助于解决法律语言理解的问题。

-------------------

推送有删改,原文见《华东政法大学学报》2018年第5期

--------------------

关注我们的公众号获取吧

封面图:Björn Öberg (bahance)

页首图:Sarah Jayne Bird (behance)返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日推荐