语音识别系统应用于庭审记录的实现路径与配套制度研究

(点击数:5648)

 

语音识别系统应用于庭审记录的实现路径与配套制度研究

上海市第二中级人民法院研究室办公室联合课题组*

【摘要】随着信息技术的发展,近年来全国多地法院逐步尝试将语音识别技术应用于庭审记录活动,给司法审判领域带来了积极作用。与传统的电脑键盘录入方式不同,采用该技术进行庭审记录后,既能够更加客观、真实、完整地记录庭审全过程,又能有效改进因人工记录速度所限导致庭审节奏缓慢的弊端,增强庭审连贯性、对抗性、效率性,同时还能将书记员从繁重的记录任务中解脱出来,缓解案多人少压力,提高司法效率。因此,大力推广这项技术在庭审记录中的应用无疑应是法院信息化建设的改革方向。当然,在新技术起步阶段,应用过程中也存在不少问题,例如识别转写准确率仍然偏低、与审判管理系统融合不够,法院的重视程度还不够,法官和书记员在新系统使用上仍不适应、配套机制尚不完善等等。从理论角度看,庭审记录方式改革,有利于落实直接言辞原则,有利于强化庭审活动制约监督,有利于明晰司法人员职责定位。为进一步推动完善庭审语音识别技术应用,法院上下应当充分认识庭审记录改革对于司法改革和法院信息化建设的重要意义,增强对新庭审记录方式的认同感和适应性,统筹规划、精心实施,制定明确的建设目标和制度规范,强化机制保障,并有针对性地就相关难题组织技术攻关,确保语音识别技术应用能充分满足庭审记录需要,更好促进司法公正和司法效率提升。

关键词:庭审记录 语音识别 文字输出 配套机制

语音识别技术(Auto Speech Recognize,简称ASR),是通过计算机相关软件将语音信号转换为相应文本或指令的过程,它所解决的问题是让计算机“听懂”人类语音,将语音中包含的文字信息进行“提取”,进而实现人机通信和交互。1随着信息技术的发展,语音识别技术集中了人工智能、云计算、大数据等多项应用,使得依托计算机服务司法审判、服务庭审记录成为现实。2012年起,安徽、浙江、上海等地法院先后开始庭审语音识别转写系统的开发研究,与科大讯飞、阿里巴巴、百度等互联网公司开展合作,将语音识别技术应用于法院庭审记录。截至2017年4月,仅科大讯飞的庭审语音识别转写系统已应用于全国27个省份的130余家法院。2笔者所在的上海市第二中级人民法院(以下简称上海二中院)是率先开展此项应用试点的法院之一,从运行情况看,庭审记录中核心语音识别效果达85%以上,法官书记员反馈良好,但也存在新系统开庭使用率不高、易用性不足等问题。

一、语音识别系统应用于庭审记录的现实意义

(一)忠实庭审原貌,客观、真实、完整记录庭审全过程

庭审记录是案件庭审全部活动和行为的主要载体,应当具备客观、真实、完整的基本特征。3通常,对表述的记录越接近原话就越能忠实反映当事人意思,越能实现庭审记录的价值功能,某种意义上讲,庭审笔录应“镜像式”复制或再现庭审中当事人陈述、法官发问等庭审原貌,不允许对原句作任何自我斟酌、改编。4电脑键盘录入的记录方式,虽较古老的手写方式更快捷,但本质仍属“手工”操作,书记员综合素质决定着庭审记录质量高低。司法实践中,首先,由于手工录入的速度局限性,尤其在当事人情绪激动、对抗性强的庭审中,书记员很难完整记载庭审中的全部内容,导致记录缺漏、信息流失。其次,书记员“归纳式”记录,系主观认识过滤和重新表达的过程,在提炼、再加工陈述人的表达之时,不知不觉可能改动原意,导致记录失真,折损庭审查明事实的作用。再次,对当事人意思“归纳裁剪”属司法判断权范畴,涉及当事人权利义务处分,应由法官而非书记员享有,传统庭审中先由书记员对庭审活动进行第一遍删繁去冗形成笔录、成为裁判依据,某种程度上导致书记员与法官间角色错位。而将语音识别技术应用于庭审记录后,以“机器换人”,则可将庭审中法官、当事人、证人、鉴定人等角色的全部陈述实时转写为文字,并进行语音备储,书记员简单调整甚至无需调整即可作为庭审笔录使用,可有效克服上述问题,既能原汁原味“全景式”记录全部庭审活动,为法官依法裁判提供重要依据,又能大大减轻书记员记录负担,让书记员从繁重乏味的记录任务中解脱出来。

(二)推动庭审实质化,增强庭审连贯性、对抗性、效率性

庭审是对各种证据进行集中展示、集中审查的环节,5突出庭审的中心地位,推进庭审实质化,防止庭前预断、庭审虚化和庭后阅卷定案,是推动以审判为中心的诉讼制度改革的关键,对保证司法公正、提升司法公信具有根本性作用。6在书记员键盘打字记录模式下,由于录入速度与话语速度不相匹配,庭审中法官为配合庭审记录,时常不得不放慢庭审节奏,提示当事人放慢陈述速度、重复陈述;当事人或律师不得不机械地从口中“蹦”词,不仅庭审时间拖长,且人为割裂庭审连贯性,对抗性难以发挥,不利于揭示案件事实真相。7另外,也有当事人全然忽视书记员记录的可能性,庭审中“机关枪”式发言,庭后则要求补正笔录,既耗时耗力,还常因此与法官、书记员产生争执。而引入语音识别技术后,庭审记录摆脱了录入速度限制,一方面,法官无需再因书记员记录缓慢、遗漏等反复提醒,可将精力集中于庭审驾驭、事实查明、释明权行使等环节;当事人或律师亦无需“照本宣科”逐字念稿进行法庭陈述,使流畅发言、连续追问、激烈辩论等成为可能,有利于揭示真相、公正裁判。另一方面,作为整个庭审过程完整准确的再现,转写的庭审笔录具有传统笔录所欠缺的全面、客观、直接等特点,易于全面回顾丰富生动的庭审信息,既能为一审法官形成合理心证提供重要保证,也为二审合议庭、审判委员会提供“亲历”一审庭审的第一手资料,更好贯彻庭审中心主义。8

(三)促进司法公正,消除笔录补充、改正造成的矛盾和隐患

我国刑诉法、民诉法均规定,当事人或诉讼参与人“认为记载有遗漏或者差错的”,可以“请求补充或者改正”庭审笔录。大多时候,闭庭后法官则会退庭,由书记员等候当事人核对庭审笔录以完成签字确认流程。此过程中,在我国法律仅对庭审笔录补正作笼统规定的情况下,往往会因书记员对案情把握不准、“势单力薄”等原因,只要当事人提出要求,即予以更正。首先,这种任由当事人随意增加或删改笔录的做法,使庭审失去了本来意义,影响司法公正。其次,若书记员不予补正,或对方当事人不同意补正时,当事人与书记员之间、当事人之间都容易因此产生争执和冲突。再次,由于庭审笔录经过书记员的再加工,当事人可能会坚持认为书记员曲解了其本意,进而拒绝在庭审笔录签字,虽然相关规定对此有解决办法,但往往可能导致当事人对法院的不信任,甚至演变成申诉、上访。备受关注的云南澄江县法院“铐律师”事件就是因代理律师认为庭审笔录遗漏己方观点拒绝在庭审笔录上签字所引发的冲突。9

另一种常见的情况是,当事人常常因个人原因,如着急处理其他事情、误认为庭审笔录不重要等,庭后并未仔细阅看笔录便匆匆签字,但笔录中个别语句对案情影响重大,若法官认同了当事人已签字的错误笔录,可能会有碍司法公正的实现。此外,有的影响还是无形的,如在当事人大段陈述时,书记员会进行归纳而非逐字记录,但核对笔录时,当事人看到大段话被压缩成几句话甚至未记录,会对笔录内容提出异议,甚至指责书记员有意为之,无形之中,当事人已对法院公正司法的能力产生质疑。对于上述种种情况,在庭审中运用智能的语音识别技术后,摆脱了人工记录的印迹,笔录能原汁原味“镜像式”准确记录下全部庭审活动,当事人“请求补充或者改正”笔录的前提和基础便不复存在,从而消除了笔录补正可能造成的冲突矛盾,避免当事人核对笔录不严谨、补正遗漏造成的裁判隐患。

二、语音识别系统应用于庭审记录存在的问题和障碍

为推进人工智能技术在法院审判实务中的应用,上海二中院自2016年12月起在该院C213、C215两个法庭为民三庭、行政庭安装了科大讯飞庭审语音识别转写系统。试运行三个多月后,又于2017年4月底在C106、C209等法庭为刑一庭、刑二庭等五个业务庭各安装一套新系统。截至2017年9月底,全院运用新系统开庭共338次,基本满足了每场庭审记录的需要,法官、书记员反应较好。但是,新系统使用中也存在不少问题,致使闲置率总体偏高。以2017年5月至7月间为例,七个法庭新系统使用率分别仅21.69%、27.69%、12.54%,除行政庭使用情况较好外,其余六个法庭新设备较少使用。综合分析上海二中院对该系统的使用情况,主要有以下三大方面问题有待改善。10

(一)技术方面有待优化

一是识别准确率仍有待提高,语速、口音和语音环境等对识别效果影响较大。不同人的说话风格,例如咬字、吞音等现象,以及语法使用的不规范性会大大降低庭审中人机交互的效率和准确性,识别过程中断句、标点等方面错误多见。对缺乏逻辑关系或固定搭配的表述识别能力较弱,对身份证号、门牌号、车牌号等组合识别错误率偏高。远场景的语音环境或嘈杂环境会削弱具有辨识意义的信号,易导致识别失效。二是对汉语方言和外语无法进行有效识别。作为一个多民族国家,我国各地语言使用情况非常复杂,现已发现并确定的方言达130种之多,全国82.15%的人在与家人交谈时习惯使用方言,11这对语音识别有不可避免的影响,方言在语音、词汇和语法结构上的多样性对庭审语音识别产生了较多阻碍,如上海话、温州话等,语音识别系统均无法识别。同时,新系统对外语的识别效果也较差。三是尚处于“孤岛”状态,未能与审判系统融合。上海法官在办案过程中常用的办案辅助工具包括审判管理信息系统、C2J法官办案智能辅助系统等,这些系统具备案件信息录入、审判节点管理、类案查询、案件报结等一系列便捷完备的功能。但目前新安装使用的庭审记录系统尚处于“孤立无援”状态,未与前述系统进行数据共享、功能衔接,案件基本信息如人名、地名、证据名称等无法以热词形式预先导入系统进行机器学习,对转写准确度有较大影响。四是兼容性有待提高,尚未能与庭审录像系统对接。从现已安装新庭审记录系统的法庭设备配置情况看,法庭中存在两个电脑主机系统,使用时需在新系统与法庭电脑原庭审系统之间来回切换,导入案件信息、热词等较繁琐,闭庭后需复制笔录并粘贴转移至法庭原系统电脑主机,再按照原庭审操作规范保存,上传笔录与庭审录像,使用便捷性体验不佳。

(二)运用方面仍不适应

一是对待新庭审记录系统的思想认识有待提高。多年来,键盘打字是庭审记录的主要方式,在当前案多人少矛盾突出的情况下,要求法官改变原有办案习惯,让书记员在庄重严肃的开庭过程中尝试全新的庭审记录方式,使得部分法官、书记员一时难以适应、难以接受,不敢迈出新系统试点脚步。二是对新系统的宣传、培训和使用情况跟踪还不到位。以上海二中院为例,虽然技术部门自2016年12月底已先后在该院七个法庭为几个业务庭安装了庭审语音识别转写系统,但还有相当一部分法官和书记员并不知晓,院层面也只是在系统安装之处组织过两次使用讲座,缺乏延伸培训。从书记员使用反馈情况看,还存在着对软件操作不熟练、使用规则不明确、注意事项不清楚等问题。三是自身能力尚有欠缺。新庭审记录方式依托于高科技,但很多法官、书记员是技术外行,对放置在法庭的多种新设备不会操作、不敢操作,对新系统抱怀疑态度甚至有畏烦、畏难情绪。在本课题组访谈中,部分受访法官表示,以机器代替书记员进行庭审记录过程中,法官既要注意把握庭审节奏,又要时刻留意新系统的设备状况、转写情况,及时提醒当事人及诉讼参加人不抢话、吐字清楚、靠近话筒等,频繁的多头操作给法官形成了压力。

(三)保障方面尚不配套

一是电子卷宗随案生成的机制尚不完善。庭审语音识别转写系统以大数据、云计算为基础,每一次庭审音字转换的识别率有赖于机器自我学习功能的发挥,有赖于每一个案件电子卷宗、案件信息、关键词的有效储备和预先导入。近年来最高法院大力倡导各地法院推进电子卷宗随案同步生成和深度应用,但真正全面实现案件随案同步生成电子卷宗,并进行文档化、数据化、结构化处理以供机器学习,仍尚需时日。二是书记员职责内容尚不明确。传统司法观念中,庭审记录是书记员主要职责之一,《中华人民共和国人民法院组织法》第40条也规定,各级人民法院设书记员,担任审判庭的记录工作并办理有关审判的其他事项。但语音识别系统应用于庭审记录后,大部分记录工作由机器完成,记录时书记员不再起实质性作用。可以预见,随着语音识别技术智能化程度的不断提高,书记员的庭审记录作用会越来越小,甚至可能完全不再需要书记员记录。这难免会导致某些当事人产生抵触怀疑心理,认为在无书记员模式下,个别庭审仅审判人员一人在场,缺乏必要监督。国内也有学者曾指出,书记员作为庭审笔录制作主体,应成为相对独立于庭审法官的公证官,实现对司法权的内部制约。12三是新系统中录音文件的法律属性有待明确。在庭审语音识别转写系统中,庭审录音是文字记录的母体和基础性资料,最能真实反映案件庭审情况。就反映当事人陈述而言,其以音频形式固定当事人陈述,反映案件相关事实,从这一角度看与视听资料并无区别;就反映庭审质证而言,其是记录这一过程的载体而非证据形式,其目的更多是将质证过程固定化、证据化。13最高法院《关于人民法院庭审录音录像的若干规定》第13条规定,诉讼参与人、旁听人员违反法庭纪律或有关法律规定,危害法庭安全、扰乱法庭秩序的,人民法院可通过庭审录音录像进行调查核实,并将其作为追究法律责任的证据,虽从某种程度已赋予了庭审录音的证据资格,但具体属何种证据类型仍尚未明确。同时,该条文规定的亦仅是庭审录音在追究相关人员危害法庭安全等法律责任时的证据资格,至于是否有作为当事人证明其他案件事实的证据资格、分属何种证据,均并未加以明确。

三、庭审记录方式改革的理论思考

(一)全面落实直接言辞原则

直接言辞原则作为诉讼法的基本原则之一,对于确保庭审活动的合法性和司法公正的实现有着至关重要的作用。直接言辞原则也称为口证原则,是指法官亲自听取当事人、证人及其他诉讼参与人的当庭口头陈述和法庭辩论,从而形成对案件事实真实性的内心确信,并据以对案件作出裁判。该原则包括直接原则和言辞原则,其中,直接原则要求法庭开庭审判时当事人及其他诉讼参与人必须亲自到庭,法官亲自直接从事法庭调查和采纳证据,强调法官的亲历性。言辞原则,又称为言辞辩论原则,它有两层含义,一是参加审判的各方应以言辞陈述的方式从事审理、攻击、防御等诉讼行为,二是在法庭上提出任何证据材料均应以言辞陈述方式进行,着重点在于作为裁判基础的庭审记录应以言词的方式形成,促使法官在当事人相互博弈中形成心证,最大限度发现案件事实。14

在书记员人工记录的传统庭审模式下,除了存在因言词记录遗漏、不规范和信息失真等造成的庭审笔录“硬伤”的问题之外,人工记录的速度限制和迟缓会影响庭审节奏和言辞原则实现,实践中甚至存在庭审进程主要围绕笔录制作而“倒置”展开的尴尬局面。一方面,它阻隔了庭审活动中当事人言词的灵动性、直观性的发挥,言辞技巧难以展现,使当事人陈述的表情、语调、呼吸等微妙信息难以形成对法官心证的支撑,影响言词原则的实现;另一方面,它使法官在庭审中无法集中精力主持庭审,难以充分施展高超的庭审驾驭技艺,影响庭审查明案件事实的功能发挥。庭审记录方式改革后,语音识别系统作为高度智能的“书记员”,摆脱了记录速度限制,庭审各方不需再顾虑话语“记录不能”,前述两个问题迎刃而解:当事人可以在庭审中集中围绕案件争议焦点充分举证、质证、辩论,当庭进行攻击与防御,通过言词辩论以陈述和证明己方观点;法官则可以更加全面准确地洞悉当事人陈述的内容,确保法官心证最大限度的接近案件事实。

(二)监督保障庭审活动规范有序

强化司法监督,建立健全审判权力运行的监督制约机制,是落实司法责任制改革的必然要求。庭审笔录作为案卷中重要的书面材料之一,必然成为对庭审活动进行监督的主要依据和重要抓手。当前对法官的监督通常都是个案监督,监督机关往往通过查阅案卷的方式进行,因此,庭审笔录内容所记载反映的庭审过程成为了判断法官是否依法裁判的重要标准。当庭审笔录具备客观、真实、完整性时,这一标准则能体现公正的尺度,使得监督机关能够依据庭审活动查明的事实,对庭审程序是否合法、法官适用法律是否正确进行监督;反之,当庭审笔录客观、真实、完整性有所缺失时,监督活动则会丧失应有的客观价值。

进行庭审记录改革后,正由于庭审语音识别转写系统具有强大的记录能力,它不仅仅是对庭审过程的真实记录,更是对法官庭审驾驭能力的一种考验和鞭策。开庭前,法官必须通过认真阅卷,了解案情、发现问题、列好庭审提纲,并对庭审中可能出现的问题做好充分应对准备,若在庭审过程中出现程序不合法、法官言词不规范、偏袒任何一方当事人等问题,均会以法庭记录形式原原本本予以记载,既会影响法官庭审形象,有损司法权威,法官也可能会因此承担差错责任、违法审判责任。这无疑对进一步强化司法权的内部监督制约机制具有正向促进作用,可以对法官的行为举止给以必要的约束,保障庭审活动符合规范,防止法官主观干预庭审笔录制作,对庭审记录信息不当筛选、过滤甚至干扰,使庭审笔录独立于法官和书记员自动生成。同时,公开透明的现代司法要求庭审活动必须置于公众的监督之下,公众除需亲自走进法庭庭审现场进行观摩和直观的价值评判外,更主要的是通过法院司法公开的载体和形式来了解和监督庭审活动。这就对庭审活动的事后可复查性提出了更高要求,而完全忠实于庭审原貌的庭审笔录可以有效实现这种目的,推动形成良性的外部监督。

(三)明晰各类司法人员职责定位

推动建立符合司法规律的司法人员管理制度,将法院人员分为法官、审判辅助人员、司法行政人员,实行分类管理,是本轮司法体制改革的重要任务之一。其中,审判辅助人员又分为法官助理和书记员。三者职责定位与分工不同,法官主要负责庭审、评议、签发裁判文书等“审判核心事务”,法官助理主要协助法官审查诉讼材料、组织庭前证据交换、接待诉讼参与人、准备与案件审理相关的参考资料、草拟法律文书等与审判工作密切相关“审判技术性事务”,而书记员则承担庭审记录、案卷归档、信息录入等相对程序化的“审判事务性工作”。15随着法院案多人少矛盾日益突出,由于书记员配置不足,法官助理代行书记员职责承担庭审记录、案卷归档等情况并不鲜见。作为法官队伍的后备力量,司法实践中过多地以法官助理代行书记员职责,从事庭审记录、归档等事务性工作,既不符合司法体制改革的制度设计本意,也不利于司法人才队伍的培养,这只是特定时期缓解办案压力的“权宜之计”。唯有“解放”书记员、提高书记员司法产出能力,才是治本之策。但是,除法庭记录外,书记员还需承担立卷、归档等众多事务性工作,司法实践中也存在着一名书记员“服务”于多名法官的情况,在繁杂工作之余,为使庭审记录更顺畅,书记员庭前往往不得不花大量时间熟悉卷宗,进一步加剧了案多人少矛盾。16

采用高度智能的语音识别技术进行庭审记录后,书记员庭审中仅需通过简单的软件操作、标点或格式调整,即可对庭审全过程适用语音转文字记录。待语音识别技术进一步提高后,甚至可实现书记员庭审不在场,这为书记员把更多精力投入其他事务性工作创造了条件;庭审记录任务减轻后,书记员“短缺”的局面也会得到根本改观,法官助理代行书记员的情形也将随之大大减少,为法官助理专心协助法官从事“审判核心事务”、有效发挥审判辅助职能、推动法官“减负增能”提供了现实可能;对法官而言,新型庭审记录方式能更好监督保障庭审规范有序进行,督促法官提升自身审判能力、充分进行个案庭前准备、集中精力于法庭主持,更好查明案件事实,实现司法公正。

四、完善语音识别系统应用于庭审记录的若干建议

(一)凝聚共识、加强培训,增强对新系统的认同感和适应性

1.提高思想认识,增强对改革的认同感。当今时代,信息技术深刻变革着司法活动,必须充分认识庭审记录改革对于司法改革和法院信息化建设的重要意义,利用现代科技更好提升公正司法的能力水平。就庭审记录方式而言,从最早的竹简记载,到后来的毛笔、钢笔记录,再到近现代的键盘录入、录音录像、语音识别转写,一系列革命性变化的背后,都是技术推动的结果。面对案多人少的矛盾以及公众对司法公正与效率的需求,司法工作人员应进一步解放思想,发挥能动性,主动向科技要生产力,依托信息化提高司法产出。

2.加强宣传培训,增强对改革的适应性。组织法官、书记员集中观摩学习新系统和数字法庭的操作方法、使用规则、注意事项,进行现场测试检验巩固学习成果,亲身感受庭审记录改革带来的高效便捷,在实践中消除顾虑、感受“实惠”,督促养成庭审时应用新系统的习惯。利用案件庭审旁听、公众开放日等活动,向当事人、社会公众、人大代表等推介庭审记录改革的重要意义。精心拍摄《庭审记录改革》宣传片,在法院网站、审判大楼显示屏滚动播放,让社会全面了解庭审记录改革情况,以加深对庭审记录改革的认识。

(二)明确目标、规范流程,增强新系统的科学性和实用性

1.统筹规划,确立科学的建设原则。语音识别系统应用于庭审记录,是法院信息化与科技法庭建设的重要组成部分,是以现代科技手段保障审判大局的新型方式,应加强对新系统建设的总体部署、统筹规划,按照国家信息建设相关规定及最高法院《科技法庭信息化建设指南》等要求,遵循系统先进性、实用性、开放性、安全性、继承性、扩展性等建设原则,构建一个功能齐全、运行高效、易于扩展、安全可靠的庭审记录应用系统,17确保系统的架构易于理解、界面简明、功能强大、维护简洁,使司法工作人员能迅速掌握全部功能。

2.精心实施,确保庭审记录各项功能全覆盖。建设庭审语音识别转写系统,是一项系统性的科技法庭建设工程,既要以满足庭审记录基本需求为指引,科学论证设计,保证系统整体结构、操作系统平台、软件平台、应用功能等有效整合,建设涵盖庭审信息自动播报、庭审模板导入、庭审信息自动获取、个案学习、多角色区分转写、笔录修正、模糊替换、消息提醒,以及笔录导出、打印、同步的多功能系统,形成“视频+音频+文字”的全链路、多层次智能记录体系,同时还要加强基础硬件设施建设,通过有效配置专用服务器、音频采集设备及专用麦克风等,达到完美支撑新庭审记录系统各项功能的目标。

3.制定规范,明确工作步骤和操作流程。最高法院2017年2月22日出台《关于人民法院庭审录音录像的若干规定》,规定通过使用智能语音识别系统同步转换生成的庭审文字记录,经审判人员、书记员、诉讼参与人核对签字后作为法庭笔录管理和使用,但对该系统的案件适用范围、庭审流程和操作规范等尚无统一规范。此前,作为较早进行庭审记录改革的地区,浙江高院曾出台《关于庭审记录录音录像改革的试行意见》和《关于庭审记录改革试点工作若干问题的纪要》,并制作《庭审记录改革实务手册》《实务问答》以供法官、书记员学习培训,有效促进了改革进展。为此,要尽快组织专项论证、研究,制定语音识别系统应用于庭审记录的实施规范,从庭前准备、庭审流程、庭后工作等方面入手,对可能遇到的问题逐一解答,并通过修改庭审大纲、拟定庭审规范用语等方式,推动法官提升新系统模式下的庭审驾驭能力,指导推进庭审记录改革。

(三)问题导向、创新技术,重点提升新系统的识别率和易用性

1.深化电子卷宗学习机制,推动个案信息抓取及深度应用。人工智能的本质是大数据驱动下的机器学习,机器的智慧程度很大程度取决于数据量的积累,针对案件各类信息、各种材料进行学习形成后语言模型,是提升系统识别率的有效途径。因此,应积极落实最高法院《关于全面推进人民法院电子卷宗随案同步生成和深度应用的指导意见》有关要求,在接收纸质诉讼材料后尽快完成电子化,实现电子卷宗文档化、数据化、结构化,并将电子卷宗与庭审语音识别转写系统进行无缝对接,由机器自动抓取资料重点片段信息并进行识别、分析、存储,同时通过对当事人名称、身份证号、地址等个性化词汇的庭前嵌入,快速适应案件庭审的特殊场景,从而加快言语判断,提高转写准确率。

2.创新多语种混合识别机制,消除方言和外语的识别障碍。目前国内的庭审智能语音识别系统主要以汉语普通话为识别对象,面对上海话、温州话等方言时基本处于“抓瞎”状态。从技术上看,语音识别系统本质上是一种模式识别系统,它的构建过程主要包括训练和识别。其中,训练是对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘、获取识别过程所需的“声学模型”和“语言模型”的过程。18因此,要解决庭审中方言识别难题,必须加强技术攻关和研发投入,解决语音和语音数据收集训练问题,可先从各地区法院中使用广泛且与普通话语音差别较大的方言入手,如上海地区常见的上海话、江西话、温州话等,逐一进行语音、语言数据的收集,进行大规模语料资源的积累沉淀,以训练数据的匹配和丰富性推动普通话与多种方言的混合识别度提升。同时,上海作为国际化都市,外语的使用也较广泛,亦应将英语、日语等语种纳入庭审语音识别系统中,以全面消除识别障碍。

3.完善专业术语词库嵌入机制,适应司法工作需要。从目前的技术应用效果看,智能语音识别对于日常生活广泛使用的常用词语和信息有着很高的识别准确率,包含交通、科技、数字数值、名人、互联网热词、新闻等领域,往往这些领域的整句识别正确率可达到95%以上。因此,应结合司法审判领域工作特点,科学研判、预测、收集法院应用场景中的相关语言数据,加强与软件公司间的需求沟通,通过内置法律法规、法律词库、生活各领域专业术语等内容,积累案件数据和言语数据,帮助软件建立术语库,以有效提高识别率。

4.建立多角色区分机制,促进法官庭审驾驭能力提升。利用声纹识别技术,解决多人说话语音分离难题,区分法官、各当事人、代理律师、证人、鉴定人等陈述人的角色信息,当发言人输入语音时,按照麦克风和角色绑定关系自动生成带角色的文本内容,实现多角色分别识别。同时,应完善角色庭审发言控制功能,尤其在庭审现场发言角色因话筒音量、极度啰嗦,影响识别效果和庭审秩序的情况下,通过对相应角色“设置静音”,一方面可对相应的麦克风进行即时“失声”控制,确保法官有效驾驭庭审,有效引导当事人有序进行法庭陈述和辩论,另一方面庭审笔录页面亦不再出现相应语音转写文本,但不影响录音及全文笔录完整性,后台仍全程记录每位发言人的文本。

(四)完善机制、强化保障,完善庭审记录改革的工作配套

1.实现与已有审判系统的无缝对接。从部分法院新旧庭审记录系统的使用对比和反馈情况看,新庭审记录系统尚难以得到法官、书记员广泛接受的一个重要原因是,其尚未实现与审判管理系统、C2J法官办案智能辅助系统、庭审录像系统等几大平台的有效衔接。单从功能上看,可以说现阶段法庭中安装使用的庭审语音识别转写系统,仅仅处于作为一类录音转写替代性工具的初级阶段。因此,大规模推广语音识别技术应用于庭审记录的当务之急是应从法院信息化全局出发,通盘考虑、统筹布局,把新庭审记录系统纳入信息化规划建设范围,加强与此前已存在的各大系统的有效衔接与深度融合,实现数据共享、功能互补的集成效应。

2.科学界定书记员职责内容。随着司法改革逐步深入,“让审理者裁判、由裁判者负责”的司法责任制和错案追究机制得以落实。书记员作为审判团队的一员,在技术发展已可使其从庭审记录中解脱出来的情况下,若单纯为强化庭审内部监督考量而坚持书记员记录模式,显然不符合新形势下法院工作需要,甚至可能与初衷背道而驰,因为传统模式下书记员笔录的制作行为更易受制于法官,19书记员的制约作用极其有限。因此,应坚持语音识别应用于庭审记录的改革方向,重新审视书记员定位,修改《人民法院组织法》关于书记员“担任审判庭的记录工作”的规定。庭审记录任务减轻后,可更多安排书记员办理程序性通知、文书校对、送达等工作,亦可协助进行简式文书编辑修改、法庭接待、外出调查取证等,以得到更全面的锻炼。当然,鉴于现阶段语音识别转写技术尚无法做到100%准确率,庭审中暂仍宜保留书记员设置,待技术更成熟后再实行无书记员模式。

3.明确庭审录音的证据法律属性。从证据学角度来看,庭审录音作为一项记录、再现庭审情况的载体,毫无疑问有着独立的证据资格,而绝非单纯意义上的技术性资料。它虽以视听资料形式呈现,但并不是一般证据意义上的视听资料,而是无须质疑的法庭资料。证据学上的视听资料是指以视频音频的形式反映案件事实的材料,只有经过法庭质证认证才有可能成为证明案件事实的证据。而庭审录音所记载的是法庭审判的全部活动,从证明审判程序合法的角度来看,它无须另行质证;同时,它记载的当事人陈述、证据的质证及当事人在案件审理全过程的表现等内容信息,亦可作为证明其他案件事实的证据材料。

 

 

注释: 

1. 袁瑛:《言语识别技术发展的制约因素和破解途径》,载《公安法治研究》2013年第2期。

2. 2017年4月,上海高院相关领导带队前往科大讯飞股份有限公司调研考察,此数据源自该公司PTT介绍稿《人工智能助力智慧法院建设》。

3.蔡晖:《析民事诉讼中的庭审笔录》,载《人民司法》1999年第7期。

4.李遵礼、杨远明:《以审判为中心场域下庭审记录方式的信息化改革——以刑事审判为例》,载《上海政法学院学报(法治论丛)》2016年第2期。

5.朱孝清:《司法的亲历性》,载《中外法学》第27卷(2015年)第4期。

6.沈德咏:《统一刑事司法标准 推进严格公正司法——略论人民法院推进以审判为中心的诉讼制度改革的工作重点》,载《人民司法》2015年第19期。

7. 宁杰、程刚:《信息化背景下庭审记录方式问题研究》,载《法律适用》2016年第9期。

8. 龙宗智:《以审判为中心的改革及其限度》,载《中外法学》第27卷(2015年)第4期。

9.参见“云南澄县法院将铐律师法官清除出法官队伍”。

10.参见上海二中院内网“信息化应用”栏目内容。

11.黄玖立、刘畅:《方言与社会信任》,载《财经研究》2017年第7期。

12.张卫平:《论庭审笔录的法定化》,载《中外法学》2015年第4期。

13.宁杰、程刚:《信息化背景下庭审记录方式问题研究》,载《法律适用》2016年第9期。

14.刘斌、薛琪:《论直接言词原则的最优价值及其实现》,载《陕西行政学院学报》2016年第2期。

15.2016年11月28日至29日,最高法院司改办主任胡仕浩率领督察组一行对上海法院司法责任制改革工作进行专题调研,参见上海市高级人民法院《上海法院司法责任制及配套改革情况的汇报材料》第9页。

16.参见浙江省高级人民法院联合课题组:《关于庭审记录改革工作的调研》,第32页。

17.参见苏州市相城区人民法院:《全省法院信息化建设项目(庭审智能语音转写系统)可行性研究报告》,第26-29页。

18.熊伟、水仲飞:《论嵌入式语音识别系统的研究与实现》,载《现代商贸工业》2010年第2期。

19.张卫平:《论庭审笔录的法定化》,载《中外法学》2015年第4期。

 

【课题组简介】

课题主持人:朱川,上海市第二中级人民法院研究室副主任(主持工作)。

课题组成员:

  咏,上海市第二中级人民法院办公室主任;

  俊,上海市第二中级人民法院办公室副主任;

玄玉宝,上海市第二中级人民法院研究室副主任;

卢腾达,上海市第二中级人民法院研究室法官助理。