TechWeb 5月26日报道 文/王蒙 婚龄多少最易发生离婚纠纷? 北京的离婚纠纷案中,哪个地区最多? 涉及子女抚养的离婚案件中,孩子多是判给女方还是男方? …… 日前,由人民法院出版社和国双科技联合制作的《法眼洞察文书数据分析报告》,对中国裁判文书网近10万份文书进行分析、挖掘,依靠大数据的分析给出了上述问题的答案。 左起:国双CTO 刘激扬、人民法院电子音像出版社副社长 张承兵、国双司法事业部高级总监 王锰 国双与人民法院出版社的合作远不止这一份报告,目前国内第一家法律知识服务和大数据智推融合的法律平台——“法信”平台的上线,正是他们通力合作的结果。 法律地图升级法律知识服务 2014年1月1日,《最高人民法院关于人民法院在互联网公布裁判文书的规定》正式实施。依据该规定,除特殊情形外,人民法院的生效裁判文书应当在互联网公布。随着这项规定的实施,中国司法裁判数据的公开程度达到世界领先水平,千万量级的司法数据呈现在公众面前。对于科技企业而言,基于这些司法数据去做分析,给大数据研究提供了另外一种思路。 2016年3月31日“法信”平台上线。这个获得最高人民法院院长、首席大法官周强点赞的项目,能够实现对海量法律条文、案例要旨、法律观点、裁判文书进行深度加工聚合、智能剖析推送,进而为法律人提供一站式专业知识解决方案,为社会推送法律规范和裁判规则。 目前,中国各类法律数据库、法律知识服务平台,很多还是传统的知识服务,只是对文献简单检索,给用户进行推送。“法信”平台从立项之初就立足打造一个与传统数据库截然不同的智能平台。 人民法院电子音像出版社副社长张承兵将“法信”平台称之为 “应然性和实然性相结合”的研究成果。“它会把传统知识服务推送已知的知识和观点与通过对案例裁判进行大数据归纳分析出的规律相结合,给法官或者律师提供判断帮助。” 据张承兵介绍,此前在搭法信平台的法律知识地图——法信大纲时,以为它就是一个数据库的后台组织方式。但是随着与国双合作,以及参加国家新闻出版广电总局的知识服务试点工程后,对人工智能技术认识逐步加深,才发现法律知识地图最有可能在大数据技术的辅助下成为未来法律智能机器人的思维基础。 张承兵说,“法律知识地图是让系统和机器来识别法律人的推导逻辑与专业思维网络的重要桥梁,我们现在从简单的法律问题开始,能够实现有人问、有人答,但是这个答是机器来答,机器通过知识地图提取,将各种碎片的法律知识点和案例从海量文献数据中提炼出来,然后回答给提问的这些人。” 法律知识地图与国双的大数据挖掘分析技术相结合,给未来智能化的法律服务带来了无限的想象空间。 双引擎让法律数据智能化 普法工作面临的一个不容回避的难题是,对法律基础知识缺乏了解的人很难读懂法律条文和判决书。 国双科技司法事业部高级总监王锰在演示法信平台的裁判剖析、同案智推应用时,TechWeb发现,法信的“自然语言”智推功能已经很好的解决了这一问题。 据王锰介绍,法信有一个“同案智推”的功能,通过这个功能可以通过口语的方式来输入法律问题,帮助你找到想要的答案。比如说“我被打了”,输入进去,就可以找一裁判文书,其实整个裁判中不会有“我被打了”这四个字。 “它不是通过检索来实现的,它是把输入的语言进行理解,找到了一些类似的情况。”王锰进一步介绍说,“这种功能有一些实际的用途,老百姓去法院打官司,他无法预测到裁判的结果,如果法信平台能够给他一些建议,不能说是绝对准确,但是可以把之前的类似案件判决推给他。由他根据先例去推导会得到一个什么样的结果,一来有助于老百姓减少委托代理律师的成本,二来,参加纠纷的人都可以看到一个先例结果,可能这些人就不需要到法院打官司,能够起到息诉的作用。” 王锰在演示过程中介绍,法信会对法律专业从业人员同样意义重大。因为专业法法律人对裁判文书的架构很清楚,通过层层剖析的搜索可以推送匹配度非常高的先决判例。 王锰称,“法信”对于法官工作的意义可以用十二字总结:难案易判、繁案速判、类案同判。 “难案易判指,法官不知道怎么判,感觉有困难的案例,法信可以提供先例判决供参考;繁案速判则是,遇到非常复杂的案件,里面有很多的点,法官可以摘出来交给法信系统来解决,把更多的精力放在不好解决的部分。”王锰继续讲道,“所谓‘类案同判’则更好理解了,对一类案件的时候统一一个执法的尺度。同时也可以让参加诉讼的老百姓,老百姓怎么感受到公正,最简单的就是同样的事儿在不同的法官那里都得到一个同样的结果,这就是公正。” “法信”拥有的两个大数据搜索引擎功能,既能满足法律专业人士的业务所需,同时又能为普通老百姓提供帮助。它能同时满足两类不同人群的需求,背后依靠的则是强大的知识体系和大数据挖掘技术,在国双CTO刘激扬看来,这也是法信平台的大数据检索功能和普通搜索引擎之间的最大区别。 自带产品经理的专业团队 国双的司法大数据解决方案区别于以往大数据在其他行业普适性的应用,是大数据首次进入一个专业垂直领域进行深耕。 据张承兵透露,法信项目立项后,先后有七八家公司与人民法院出版社有过接触,想合作开发这个平台,但最终还是选择了国双。 “国双是唯一一个不是实验室的产品,”谈起与国双的合作,张承兵说,“很多之前来给我们提供分析模块的产品,一旦脱离特殊的条件和环境就推不准了,但是我们认为国双完全达到应用级了。” 在同类型产品尚处于实验室阶段的时候,国双为什么能够实现应用场景的落地?刘激扬认为有三个非常重要的原因。 首先,国双具有高性能的分布式数据采集、存储、和挖掘的技术。无论是企业还是政府部门,国双都可以用他们需要的方式去收集对他们有关的、有用的数据,对这些数据进行整理和分析,最后把它有效的存储起来; 其次,国双还拥有其他非常关键的技术,比如自然语言处理和机器学习技术,判决文书、文本,企业客户需要了解自己产品在用户中的反馈,国双都可以把它收集起来进行分析; |