陕西省人民检察院 /       联系电话:0911-6223820
当前位置: 首页 > 检察动态

关于大数据法律监督建模的几点体会

发布时间: 2023-05-26

  

  延安市安塞区人民检察院 

  党组书记  检察长 

  呼延涛 

  通过参加市检察院举办的专题培训班,我对数字检察智慧检务的认识理解更加明确、强力推进更加坚决。转变理念,能动作为,实现数据赋能、智慧监督是发展趋势,也是势在必行的工作形势。为了构建“业务主导、数据整合、技术支撑、重在应用”的数字检察工作模式,探索更多法律监督模型的运用,促进检察工作全面提质增效,首先要弄清几个概念,厘清几个问题。 

   三 点 认 识  

  大数据法律监督模型是以大数据库为基础的,数据库的数据量大小直接影响着数据碰撞结果和产生的效能;碰撞规则是对数据的加工,对这一过程予以固化并推广应用,也就是一个模型建立的过程。建模之前,几个概念必须要先搞清楚。 

  检察大数据 

  检察大数据要有多大的数据库?什么可以称作是检察大数据?我觉得标准应该是看实际需要,只要数据量达到,可用于发现检察办案中所需掌握类案特点或规律的数据量就可以称之为检察大数据;当然,也可以是各种电子材料,比如对纸面卷宗等传统介质的材料进行扫描、OCR识别、摄录而出现的电子化材料等。安塞区院参加全省大数据建模竞赛的环境保护税法律监督模型,共搜集到行政审批、生态环境、住建等部门200多条数据,发现线索114条,通过对数据进行分析比对,督促30余家企业补缴了税款和滞纳金。由于区域经济发展的客观情况,现有数据量较小,使得最终的法律监督效果不显著。这也说明数据少了不一定就不是检察大数据,但数据少了,其碰撞的结果和法律监督效果一定是不够充分的。 

  大数据建模 

  数据建模就是把司法办案中发现的具有普遍性的“监督点”以及发现监督线索的过程“固化”下来,形成一套可推广的体系。这个过程中,关键在于通过求同、求异对数据进行分析比对和对类案特点或规律的提炼。大数据建模可以分为初级阶段的建模和高级阶段的建模。安塞区院环保税法律监督,通过对行政审批、电力、自来水公司获取的企业经营情况与税务、生态环境部门数据进行对比分析,产生法律监督效果的数据模型是初级阶段的。数据建模的高级阶段,是模型的应用,通过数据源——简单的技术分析平台——自动输出结果,实现类案监督,最终建设应用平台,对动态导入的数据实时监测预警,实现搜集数据源——建模引擎——动态预警线索推送结果反馈。 

  怎么建模 

  一要有想法。要让办案干警树立数字检察理念,善于从个案中分析类案,看到现象背后的潜在规律,鼓励大家多出金点子,挖掘模型来源。二要有方法。我们目前的建模还处于初级阶段,先从最基本的数据碰撞入手,抓住一个易见常见的监督点,通过大数据比对,拓展线索数量。三要有做法。大数据法律监督是大势所趋,我们不是旁观者或局外人,要以推进类案治理的思维方式,开展理念转变、数据拓源、模型研制以及长远的应用推广,我们要争做大数据法律监督的行动派。另外,建模是为了应用,不一定所有的院都要搞建模,“拿来主义”直接应用也是很好的选择。 

   三 点 想 法  

  关于建什么模型的问题 

  建立模型是为了服务办案,建什么样的模型是由实际办案中遇到什么样的问题、发现什么样的类案决定的。一个模型的建立不只是要把这一类案子办好,还要触类旁通,服务于其他类似案件的办理。模型的应用要助力于服务保障区域经济社会发展,建模的方向应关注于地方党委政府的重点工作和人民群众对新时代司法工作的新期待。要按照“三个年”活动部署要求,以“三有”争创活动为抓手,充分发挥检察职能,积极探索优化营商环境“检察模式”,当好保障员、护航员、服务员,护航企业健康、规范、有序经营,全力服务保障区域经济社会高质量发展。 

  关于建模必要性的问题 

  大数据建模要以结果为导向,没有突出的办案成效,没有良好的社会效果,没有应用推广价值的模型就不要搞。只有在办案过程中认真研究,思考提炼,才能发现有价值的类案特点规律,才能建构具有良好社会治理效果的法律监督模型。不能把建模完全寄托于第三方公司,请来的公司对我们的业务大都不熟悉,让公司去发现类案、规律,去建立碰撞规则是不现实的。所以,首先需要检察干警自己想清楚,捋明白,需要我们自己设计文档,并反复推敲、印证。 

  关于打破数据壁垒的问题 

  有数据是前提,没有一定的数据资源,谈何数据碰撞、分析、比对等后续工作;数据要有而且还要优,首先要保证数据源有效、可信、可推广使用,防止无效数据产生无意义结果。例如,在不同部门获取的有人工抄录的、不同格式的简称、全称等数据,需要检察工作人员进行核实确认统一化操作。我们需要的数据大致可以通过两个渠道获取:一是内部开发。对统一业务系统数据的深度挖掘,唤醒沉睡的数据。二是外部拓展。打通“信息孤岛”,用好公安机关的执法平台、法院的裁判文书网、行政单位的行政执法监督平台。数据的获取还应该注意方式方法,初步的数据建模,坚持多赢双赢共赢的理念更容易赢得配合,分批次更容易获取有效数据。 

   三 点 建 议  

  • 无论是司法数据还是社会数据,均会涉及到个人或单位的敏感信息,必须对已有数据加强安全管理,规范数据使用,确保数据在存储、传输和使用过程中的安全性,这是首要的。 

  •  “数据孤岛”的存在,严重制约了数据价值的释放,打破数据壁垒是大数据法律监督建模的关键,市级层面应尽快建立“大数据超市”,打通数据产品化和数据消费“最后一公里”,以低成本、短周期、高效率的方式实现各类数据提取和应用,亟待加快推进。 

  • 受数据量少、人力资源不足等因素的制约,鼓励基层院之间相互联合或者市县院联合,建模成本会更低、收效会更好。 

作者|呼延涛 
扫一扫在手机打开当前页