想知道明星犯罪该判多少年?教你用技术做法律判决预测
作者 | Rainie Liu
人工智能是当今社会的热点,它以迅猛的发展势头不断冲击着人们的日常生活,也给法律行业带来全新的挑战。早在 30 多年前英国著名法学学者 Susskind 在其著作《明天的律师:预见你的未来》(Tomorrow’s Lawyer: an Introduction to Your Future)就认为法律行业 200 年之内的变化最大即是人工智能。但目前大多数人仍然认为,自己距离法律人工智能十分遥远。
转眼春节将至,聚餐喝酒成为不少人的常态,酒驾案件在此期间也往往频发。但是,你知道醉酒驾驶的标准是多少吗?你又了解醉酒驾驶的刑罚是怎样吗?
曾经的央视主持人郎某某醉驾案被曝出后,就有不少人在网上议论纷纷。
其中一个回答非常有意思,回答者从案情因素、政策背景、类案参考三方面进行分析,判断出郎某某醉驾事件预期量刑拘役大约为 3 个月,不缓刑,罚金 3000-5000 元,而回答者主要通过华宇元典智能量刑辅助系统对类案的大数据对比分析进行判断。
随后不久,北京朝阳法院官方微博发布郎某某危险驾驶案一审宣判结果,郎某某犯危险驾驶罪被判处拘役 3 个月,并处罚金 4000 元,判决结果和预判结果十分接近。一时间,网友们除了花式夸赞法律 AI 技术之外,也有不少人开始思考法律 AI 带来的一系列问题,包括法律 AI 是否能满足人们日常需求、法律 AI 对量刑结果预测的准确程度、法律 AI 是否将替代法律人等等问题。近日,我们邀请了华宇元典技术总监 & TGO 鲲鹏会会员李东海来为我们进行解答。
李东海 | 北京华宇元典信息服务有限公司技术总监 & TGO 鲲鹏会会员
李东海,北京华宇元典信息服务有限公司副总经理,技术总监,TGO 鲲鹏会北京会员,中国中文信息学会语言与知识计算专委会委员,2018 年度新锐领军程序员,清华大学首期创新领军工程博士在读,多项法律技术领域相关专利的发明人。
当下互联网企业的产品,主要分为 To B 面向企业提供服务和 To C 直接服务于个人两个大方向,而法律行业却有些不同。当 TGO 鲲鹏会记者问到华宇元典产品主要面向的用户群体时,李东海说,元典在成立之初就坚持在法院、检察院、律师、法务等市场进行完整的产品链布局,基本包括整个法律生态圈。TGO 鲲鹏会记者注意到,华宇元典除了面向律师、法务市场的产品,其中还有一部分面向法院、检察院的 To G 产品(To G 是指 To Government)。李东海解释,这与法律行业的现状息息相关。
根据司法部公布的 2017 年度数据,中国执业律师数量约为 36.5 万人,过去一年办理的诉讼案件数量是 465 万余件,年平均办案量大约十来宗,而不少发达地区的法官年人均办案量却为数百宗。司法机关直面民众纠纷,拥有更大的纠纷量,这是一个数据更加富集,并让智能拥有更多施展空间的领域。
李东海从进入华宇集团开始,就一直为司法机关提供技术服务,帮助司法机关打通数据链条。最初,华宇研发桌面 MIS 系统供法律人录入案件数据;渐渐地发展成为通过数据联网,让上下级法院做数据交换,最后建设涵盖全国四级法院的网络,实现各级法院数据的互联互通。
目前,华宇元典作为华宇集团旗下子公司与其他兄弟公司一起凭借法律科技技术、场景化的应用软件和解决方案创新、专业的法律数据和知识服务能力、覆盖全国的市场营销和服务体系,已经实现建设 22 个省级法院大数据平台、16 个省级法院人工智能平台、21 个省级电子诉讼平台、11 个省微法院等。
同时,由于当前立案制改革,案件数量爆发,随着社会经济情况的不断变化,案件复杂度也相较以往提高,但法律从业者人数却没有同比增长。因此,除了建设大数据平台,构建数据连接之外,解放整个法律行业生产力的需求也变得尤为迫切。元典及其兄弟公司希望以一系列场景化智能应用,实现司法机关不同业务场景下的需求。从庭前阅卷辅助到类案精准推荐,从庭审笔录自动生成到裁判文书智能撰写,这些贯穿于业务流程中的数据流通与智能应用致力于降低整个司法过程的成本,提高最终司法和商业法律服务的效率和质量。
以上这些平台及应用,都是基于法律认知能力实现,这也是对于华宇元典来说难度最大的部分。案件里存在各类因素和要件,法律本身也往往存在大量争议和模糊地带,如何让机器认知要素和整体案情,区分相似与不同,并且让区分越来越精细,如何将法律人的经验智慧转化为机器智能并在实务场景中服务于法律人是极具挑战性的研究领域,也是元典迫待解决的核心问题。
李东海举了两个例子,比如对盗窃罪量刑的案例,我们需要去判断是否存在入户盗窃等盗窃罪特有的要素情形,还需要考虑大多数犯罪都有的普遍情形,比如盗窃者是未成年人还是成年人,他盗窃后是否自首,以及盗窃动机等等去形成完整的法律认知概念;再比如针对入户盗窃这一专门要素情节,我们需要将现实中发生的情形和法律规定的入户情形对应起来,比如翻窗进入房间毫无争议算入户,翻越高墙进入也算入户,若是你抬腿跨过一堵篱笆墙,是否还能被判断为入户,这个是存在一定争议的,需要参阅法学专家们对于入户这个概念的定义,但最终应该还是由法官来进行决策判断。同时,由于语言表述相当丰富,落于文本时较为容易产生歧义,这也需要通过更多中文处理和人工智能技术手段辅助法官进行分析解决。
法律认知能力的训练是一个漫长而复杂的过程。譬如,在类案推送场景中,通过用户反馈数据对判断模型进行修正,推送相应的类似案例给用户参考,用户最终的判断再形成一个权威、真实的案例进入系统中,这才做到让数据真实地在系统中循环起来。
相较于自动驾驶、金融 AI 、安防 AI 、医疗 AI 的热度,法律 AI 较为鲜为人知,那么是否意味着 法律 AI 的发展较为缓慢呢?在李东海看来,现实并非如此,法律 AI 相较于医疗 AI 来说,发展相对比较快速。这主要是因为目前医疗领域数据分散,数据打通十分困难,而法律行业是一个非常垂直的收集数据过程。
华宇元典以元典睿核为底层支撑平台,目前已经推出元典律师工作平台、元典智库、元典律师文书助手、元典智能量刑辅助系统等多款面向互联网端及专网端的不同产品。谈到元典睿核时,李东海脸上不自觉地露出了自豪的笑容。元典睿核是他开发的难度系数最高,未来价值最大的产品。它需要将所有数据聚集起来,通过挖掘分析更深层的含义,将所蕴含的知识、经验和案例聚集起来,通过标记在平台里形成数据,再让机器进行学习。所以它的难度主要体现在:一方面需要解决数据标注的人力投入,另一方面需要在算法上进行革新,减少训练所需要的样本量。
为了解决这两方面的问题,华宇元典将人工智能的模型训练提前到数据标注阶段,让机器尽快去形成一个模型,在边学边练的模式下产生一个整体循环,首先是辅助法律人进行数据标注,减轻人力投入,其次是即使在少量数据样本的情况下,依靠算法的改进也能学习出一个相对可靠的模型。虽然数据越多,精准度会越高,但是现实情况下,这样大量的数据是不存在的。通过少量样本、少量数据学习训练一个准确的模型,这也是当下华宇元典仍然在攻克的难题。“眼下我们需要将大数据与实际应用场景更好地结合,才能使法律 AI 有足够长远的发展”,当 TGO 鲲鹏会记者与李东海聊到关于行业突破点时,他说,“目前应该解决如何将法律知识向量化,并将与文本语义分析结合起来,才能让行业有真正的突破”。
现今,随着人工智能技术的进一步发展,AI + 法律逐渐出现在人们的面前,而面临“AI 替代人”的呼声,法律人真的将被取代吗?李东海笑称,“人工智能并不会替代法律人,它只作为一名助手存在”。AI 只是辅助法律人解决问题,这相当于 AI 和人是一个配合关系,机器可以作为法律人初步筛选的工具,比如阅读文档,匹配相关法律法规,列举相似案情等方面,因此人工智能将更好的帮助法律人读取繁琐的法律文献,寻找数据瑕疵,取代人类重复性较高的工作。
未来,法律 AI 将帮助人们更好的知法、懂法、守法。
李东海:对于技术人来说,第一需要积极解决 AI 技术的实际应用场景问题,多多思考技术的实践性;第二需要保持对技术的敏感性,因为现在人工智能迭代的速度相当迅速,可能当前很好的一项技术,只过了一两个月就慢慢地被新技术替代;第三需要主动了解不同领域,原先很多技术人认为“吃透一门技术便能走遍天下”,但目前人工智能技术将向广度发展,我们需要掌握更多的技术,了解更多的解决方案,从中选择最优的方式。
对于法律人来说,我认为首先法律人应该更多地去思考,在实际办公中,哪些重复性的工作能够被机器取代。其次多了解 AI 智能的原理,以客观的角度看待 AI 技术,目前 AI 技术只能达到基础的辅助作用。假设原先一个人审查宗卷需要 50-60 分钟,但通过机器去抽取信息,帮助他做筛选,那么可能整个处理案件的流程都会加快。
李东海:这个主要是希望能把自身的本领发挥出更大的作用。
或许我一个人做事能把事情做到比较好的程度,但是如果能有人帮着一起做,那么就可以做更多的事情。虽然我没有办法一个个去完成,但是能通过判断做一些把控。如此循环下去,你会发现自己更多的精力会放在判断技术是否靠谱。其次,会有更多的时间去判断做出来的东西是否能达到市场的需求。最后,考虑如何组织人员高效开发,能够按照你的思路、用户的思路去实现出来。
所以这些主要源自于我想要做更多的事情,想要通过更好的方式将我的能力更大地发挥出来。
李东海:如何判定成功呢?你通过这款产品挣到钱算成功吗?这也不太一定,因为你设计一款产品的目标是为了让你的客户觉得这款产品对他是有用的,这个才是判断成功的标准,挣钱只是这个目标实现后的一个附属产物。
我认为有成就感的是,有一批人能与我们一起去完成 AI + 法律这件事情,让大家对法律有更强的理念,帮助更多法律从业者去解决问题。
在未来,可能真的能像科幻小说一样,通过 AI 将所有文档阅读一遍,人们只要通过问答的方式向 AI 提问,就能快速地梳理整个案件的关键信息。
李东海:因为经常参加一些技术大会,看到 TGO 鲲鹏会这个宣传,让我感觉 TGO 鲲鹏会很亲切。并且我觉得 TGO 鲲鹏会是一个很好的组织,它能让我学习到在课堂中,或者在专业培训中学习不到的东西。
同时我希望能通过 TGO 鲲鹏会结识到更多优秀的科技领导者,帮助我解决一些技术公司里常见的困局,比如招聘人员的存留,人员的培养,如何带好技术团队等,这些都是我一直想要深入去思考、学习的内容。
我本身其实对技术人社交很感兴趣,因为平时可能社交的机会也不是特别多,相比较律师界社交的体系、规模,技术界还是有一些不足的地方,所以我们需要有一个组织帮忙组织起来。