提高法律信息检索的精准度,聚法科技从交叉检索和可视化入手

黄瑶 · 2017-04-24
未来要做法律数据的深度挖掘与应用。

随着2014年1月1日起开始实施的裁判文书全部公开,互联网技术对于法律行业的改造开始加速。其中一个切入点是法律搜索引擎,解决法律大数据海量信息查找耗时耗力的问题。

2014年成立的法律大数据平台聚法科技,主要为法律人提供搜索工具。去年10月推出聚法案例搜索平台,通过案例检索、法规检索和可视化检索,解决法律人“查找难、统计繁”的问题。同一赛道的我们还报道过无讼理脉

法律人对于裁判文书、法律法规搜索的准确度、完备度要求很高,搜索结果是否全面影响着其最终的法律分析。一般来说,法律文书少则2000字,多达10万字。根据聚法科技创始人梁海强的调研,用户在检索过程中,70%的时间其实是在判断搜索结果是否符合自己的需求。

举个例子,用户想检索有关信用卡诈骗被判无罪的判决书,如果使用其他的案例搜索引擎搜索关键词“信用卡诈骗”、“无罪”,会得到400多篇文书,这当中有大量的内容是辩护人请求无罪,而不是法院判定无罪。如果要一一鉴定,十分浪费时间。

为了快速帮助用户找到有效文书,聚法科技将文书做了深层解构,按照本院认为、裁判结果、审理经过、上诉人诉称、被上诉人辩称等,划分了22个区段。“分类越细,用户交叉搜索的维度越多,结果就越准确”,梁海强说,“由于每个法官写作文书的风格不一样,精准切分涉及的技术难点也比较高。”

这样一来,用户在聚法案例搜索框输入关键词后,在搜索框右侧选择区段,会极大提高检索效率。还以上面的例子来说,搜索“信用卡诈骗案件中,最终判决无罪的案例”,输入“信用卡诈骗罪”,再输入“无罪”,右侧区段选择“裁判结果”,精准检索到10篇,为用户节约了97%的检索时间。

除了交叉检索,为了方便用户进行统计,聚法科技早在2016年10月份还上线了可视化检索工具。梁海强介绍,这个功能最初是其太太提出的需求。作为法学院老师,她在做论文时需要大量的数据搜集、直观展示,每次搜集的主题还都不一样。经过调研后梁海强发现,这也是绝大多数法律人的痛点。因此,团队研发出海量数据高速实时统计技术,不对用户的搜索问题做提前假设,也不限制用户只查某个律所、法院的数据,而是能够做到无限维度、任意主题、深层嵌套、完全实时,并将30秒的搜索结果最终优化为2秒内。将于近期更新的新版可视化还将开放更多维度。

在满足了用户精准检索、浅度运用大数据的需求的同时,聚法科技还想深度挖掘法律数据的价值,帮助法官、律师、企业法务和法学研究者有效利用法律数据。比如,通过对海量案件数据的分析,对某一类型的案件进行预测;或者提供不同条件下的不同裁判结果参考,告知哪位法官更倾向支持原告,哪个法院的支持力度更大等;另外,通过对裁判结果和引用法条的统计分析,以及典型案例中的争议焦点和裁判观点的因果关系分析,形成对应的诉讼策略。 

法律人对经验的依赖性很强,聚法科技主要在同律所合作建模,利用律师、专家积累的大量实务经验,形成数据模型。目前已有知识产权、贪污、公司、劳动法等六七个比较成熟的模型,产品也将于近期推出。

目前,聚法科技目前有近3700万篇判决文书,200万条法律法规。用户5万人,主要通过微信公众号和口碑推广。公司已于去年年底完成数百万元天使轮融资,投资方为深圳卓越律商。

团队方面,公司目前40多人,70%为技术,20%为法律相关人员。创始人梁海强曾任职华为和澳客网,拥有十余年互联网产品开发和管理经验,擅长海量数据处理、自然语言处理、机器学习、数据挖掘与用户系统规划;联合创始人张斌,法学博士,广东卓建律师事务所主任、首席合伙人,曾联合创办知识产权一站式维权平台安盾网;联合创始人张茂荣 ,美国西北大学法学硕士,曾任 DAC 资产管理有限公司项目经理兼法务经理,乐视网信息技术(北京)股份有限公司高级法务经理及法律与政策研究院执行院长。 此外,公司还有一批由法学院教授、律师事务所合伙人等组成的法律专家顾问团队。

+1

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业