广西电信IDC信息安全管理系统(爬虫版) - 解决方案 - 任子行:网络空间数据治理专家
广西电信IDC信息安全管理系统(爬虫版)

用户背景

       中国电信广西分公司作为网络运营商,为用户提供互联网内容信息,按接入方式划分主要有ADSL拨号普通宽带用户、专线用户、IDC主机托管/租用用户等,专线用户、IDC主机托管/租用用户是不良信息容易出现并且集中的高发敏感区域,根据国家中央九部委关于互联网信息安全管理工作指示、工信部关于网站备案信息管理工作的要求,以及中国电信集团召开的信息安全管理工作会议精神,专线用户、IDC机房已成为互联网信息安全监管的主要区域,重点监管专线用户、IDC主机托管/租用用户的网站中存在的违法信息、低俗互联网信息及网站未备案或虚假备案等情况。

需求分析

   由于互联网的复杂性、多变性、海量数据等特点,中国电信广西公司的业务总量越来越庞大、业务种类和内容越来越丰富,人工预审/监控检查工作难以满足信息内容安全监管覆盖和深入要求,同时还增加了业务运营成本,牵制了业务的发展;现有的技术管理手段,无法实现对互联网信息大范围自动检查以及处理等,因此出于内容安全责任的考虑,中国电信广西公司需要一个良好的可持续性解决方案来辅助监管互联网信息。

业务需求

1、提高信息安全审计效率

    随着中国电信广西公司数据网络(包括网内的IDC)规模的不断增大,使其逐步成为了各类网站及应用系统的主要集中地,同时也是网络信息传播的主要区域和节点,采取技术手段加强对中国电信广西公司数据网络的信息监控,将会更有效的切断违法信息传播链条,与传统的人工监控相比,部署智能化的信息安全监控设备将大大提高监控效率,色情有害信息难以藏匿。

2、回避企业经营风险

   互联网上色情、有害信息已经越来越引起媒体的高度关注,国家级媒体增多次曝光和点名了部分运营商,引起了强烈的社会反响,尽管目前很多色情、有害信息已经开始地下隐蔽经营和发布,而且受众也仅限少数成人,但一旦曝光,已然会对电信企业造成极大的负面社会影响。

3、无线数据接入的内容监控需求

   随着电信的3G移动网络建设逐步铺开,移动终端的上网需求也开始发生爆炸性的增长,运营在IDC的WAP网站会越来越多,这也将导致大量色情有害信息开始向移动终端渗透。

解决方案

   任子行网络技术股份有限公司先进的技术和优秀的产品获得了中国电信广西公司的认可,并担任系统的建设。经过多轮沟通和论证,我们为客户提供了一体化的信息内容监测和未备案信息的安全解决方案。系统采用爬虫模拟用户请求,负责网页的抓取,对网络内容进行文字不良信息匹配识别,并对整个采集过程进行控制和监视。爬虫系统主要由安装有爬虫搜索软件的服务器构成,它需要根据目标网段/主机IP地址查出网站域名,并以此为关联搜索和入口抓取网站信息内容,从而实现对信息内容的检查。

系统逻辑结构

 

效果反馈

        通过信息安全管理系统通过信息安全管理系统对违法信息进行记录并进行人工审核和处理,实时了解和掌握接入广西电信互联网内的信息,最大化的解决了信息监测和管理的难点,对网站备案情况也能有效管控,同时也减少了人力成本。该系统的应用超过了预期的效果,并在集团、部扫黄打非等检查中获得高度好评。