(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 107292517 A(43)申请公布日 2017.10.24
(21)申请号 201710477539.X(22)申请日 2017.06.20
(71)申请人 科技谷(厦门)信息技术有限公司
地址 361009 福建省厦门市湖里区安岭二
路88号804、805单元(72)发明人 陈思恩 吴炎泉 杨紫胜 廖雅哲 (74)专利代理机构 厦门致群专利代理事务所
(普通合伙) 35224
代理人 刘兆庆 邓贵琴(51)Int.Cl.
G06Q 10/06(2012.01)G06Q 50/26(2012.01)G06Q 50/30(2012.01)G06F 17/30(2006.01)
(54)发明名称
基于大数据分析的民航安保信息服务系统(57)摘要
本发明公开了基于大数据分析的民航安保信息服务系统,包括大数据存储单元、数据采集单元、分析引擎、图谱单元、机器学习引擎及查询单元;所述数据采集单元用于采集原始业务数据,并将所述原始业务数据存储到大数据存储单元;所述分析引擎基于原始业务数据进行分析,获得与重点关注人员有关的预警信息;所述图谱单元采用图数据库和力导图的可视化技术,还原出重点关注人员的人物关系网络;所述机器学习引擎用于提供所述分析引擎、图谱单元在工作过程中所需的算法模型;所述查询单元用于提供基于与、民航相关的关注要素的模糊查询和特征检索。
权利要求书1页 说明书3页 附图1页
CN 107292517 ACN 107292517 A
权 利 要 求 书
1/1页
1.基于大数据分析的民航安保信息服务系统,其特征在于,包括大数据存储单元、数据采集单元、分析引擎、图谱单元、机器学习引擎及查询单元,其中:
所述数据采集单元用于采集原始业务数据,并将所述原始业务数据存储到大数据存储单元,所述原始业务数据包括民航订票数据、机场安检数据、数据以及重点关注人员名单数据;
所述分析引擎基于原始业务数据进行分析,获得与重点关注人员有关的预警信息;所述图谱单元采用图数据库和力导图的可视化技术,还原出重点关注人员的人物关系网络;
所述机器学习引擎用于提供所述分析引擎、图谱单元在工作过程中所需的算法模型,所述机器学习引擎基于spark分布式计算框架实现,其包括数据探索模块、数据预处理模块、模型训练模块、模型评估模块、模型可视化模块及模型预测模块,所述数据探索模块用于对数据进行分布统计、相关性分析、假设检验及核密度估计,所述数据预处理模块用于对数据进行清洗、转换、加载、特征提取及特征选择,所述模型评估模块用于对已训练好的模型进行评估,所述模型可视化模块用于实现模型的可视化显示,所述模型预测模块用于将模型固化到生产环境、实时推送预测信息以及生成分析建议报告;
所述查询单元用于提供基于与、民航相关的关注要素的模糊查询和特征检索。2.如权利要求1所述的基于大数据分析的民航安保信息服务系统,其特征在于:还包括地图检索单元,所述地图检索单元用于提供地图级别的检索和跟踪分析,以实现重点关注人员的行动轨迹跟踪。
3.如权利要求1或2所述的基于大数据分析的民航安保信息服务系统,其特征在于:所述图谱单元包括HDFS文件系统、图数据库引擎及应用层,所述HDFS文件系统上存储有HBASE数据库和Solrcloud索引,所述图数据库引擎包括数据及索引存储层、数据库层及ClientAPI层,所述数据及索引存储层与所述HBASE数据库和Solrcloud索引相连,所述ClientAPI层与所述应用层相连,所述应用层用于提供海量关系运算、海量检索、关系关联、手工绘制、GIS整合、实时关系运算、关系扩展、特征查询、属性收集及图分析。
4.如权利要求3所述的基于大数据分析的民航安保信息服务系统,其特征在于:所述分析引擎包括人员名单管理模块及预警值计算模块,所述人员名单管理模块用于对列入黑名单、红名单的重点关注人员信息进行管理,所述预警值计算模块基于关系算法计算与重点关注人员有关的预警信息。
5.如权利要求3所述的基于大数据分析的民航安保信息服务系统,其特征在于:还包括人工绘制单元,所述人工绘制单元用于手工补充人物关系数据以及管理维护人物关系数据。
2
CN 107292517 A
说 明 书
基于大数据分析的民航安保信息服务系统
1/3页
技术领域
[0001]本发明涉及大数据处理技术领域,特别涉及基于大数据分析的民航安保信息服务系统。
背景技术
[0002]目前乘坐民航航班是人们的重要出行方式,如何实现对不法分子乘坐民航航班的有效监控、如何及时发现危险人员对航班安全的威胁,成为门和民航单位关注的重点。
[0003]目前,和民航的各个关注要素的数据凌乱分散,数据种类多、存量大,新数据产生快,难以利用各个部门的数据实现对不法人员行程的及时有效分析,门和民航单位难以针对不法分子做出快速、精准的响应。发明内容
[0004]为解决上述问题,本发明提供了一种基于大数据分析的民航安保信息服务系统,其能够根据和民航的数据,进行以人为中心的图谱还原,全方位还原出人的行为和关系脉络,能够实现安检、订票数据的实时关注预警,及时、精准的针对不法人员做出响应,从而实现了对不法分子乘坐民航航班的有效监控,及时排除不法分子对航班安全的威胁。[0005]本发明采用以下技术方案:
[0006]基于大数据分析的民航安保信息服务系统,包括大数据存储单元、数据采集单元、分析引擎、图谱单元、机器学习引擎及查询单元,其中:[0007]所述数据采集单元用于采集原始业务数据,并将所述原始业务数据存储到大数据存储单元,所述原始业务数据包括民航订票数据、机场安检数据、数据以及重点关注人员名单数据;
[0008]所述分析引擎基于原始业务数据进行分析,获得与重点关注人员有关的预警信息;
[0009]所述图谱单元采用图数据库和力导图的可视化技术,还原出重点关注人员的人物关系网络;
[0010]所述机器学习引擎用于提供所述分析引擎、图谱单元在工作过程中所需的算法模型,所述机器学习引擎基于spark分布式计算框架实现,其包括数据探索模块、数据预处理模块、模型训练模块、模型评估模块、模型可视化模块及模型预测模块,所述数据探索模块用于对数据进行分布统计、相关性分析、假设检验及核密度估计,所述数据预处理模块用于对数据进行清洗、转换、加载、特征提取及特征选择,所述模型评估模块用于对已训练好的模型进行评估,所述模型可视化模块用于实现模型的可视化显示,所述模型预测模块用于将模型固化到生产环境、实时推送预测信息以及生成分析建议报告;[0011]所述查询单元用于提供基于与、民航相关的关注要素的模糊查询和特征检索。
3
CN 107292517 A[0012]
说 明 书
2/3页
优选地,还包括地图检索单元,所述地图检索单元用于提供地图级别的检索和跟
踪分析,以实现重点关注人员的行动轨迹跟踪。[0013]优选地,所述图谱单元包括HDFS文件系统、图数据库引擎及应用层,所述HDFS文件系统上存储有HBASE数据库和Solrcloud索引,所述图数据库引擎包括数据及索引存储层、数据库层及ClientAPI层,所述数据及索引存储层与所述HBASE数据库和Solrcloud索引相连,所述ClientAPI层与所述应用层相连,所述应用层用于提供海量关系运算、海量检索、关系关联、手工绘制、GIS整合、实时关系运算、关系扩展、特征查询、属性收集及图分析。[0014]优选地,所述分析引擎包括人员名单管理模块及预警值计算模块,所述人员名单管理模块用于对列入黑名单、红名单的重点关注人员信息进行管理,所述预警值计算模块基于关系算法计算与重点关注人员有关的预警信息。[0015]优选地,还包括人工绘制单元,所述人工绘制单元用于手工补充人物关系数据以及管理维护人物关系数据。[0016]采用上述技术方案后,本发明与背景技术相比,具有如下优点:[0017]本发明根据和民航的数据,进行以人为中心的图谱还原,全方位还原出人的行为和关系脉络,能够实现安检、订票数据的实时关注预警,及时、精准的针对不法人员做出响应,从而实现了对不法分子乘坐民航航班的有效监控,及时排除不法分子对航班安全的威胁。
附图说明
[0018]图1为本发明的结构示意图;
[0019]图2为本发明图谱单元的结构示意图。
具体实施方式
[0020]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。[0021]实施例
[0022]参考图1所示,本发明公开了基于大数据分析的民航安保信息服务系统,包括大数据存储单元1、数据采集单元2、分析引擎3、图谱单元4、机器学习引擎5及查询单元6,其中:[0023]数据采集单元2用于采集原始业务数据,并将原始业务数据存储到大数据存储单元1,原始业务数据包括民航订票数据、机场安检数据、数据以及重点关注人员名单数据。
[0024]分析引擎3基于原始业务数据进行分析,获得与重点关注人员有关的预警信息。分析引擎3包括人员名单管理模块及预警值计算模块,人员名单管理模块用于对列入黑名单、红名单的重点关注人员信息进行管理,预警值计算模块基于关系算法计算与重点关注人员有关的预警信息。
[0025]图谱单元4采用图数据库和s力导图的可视化技术,还原出重点关注人员的人物关系网络。图谱单元4包括HDFS文件系统、图数据库引擎及应用层,HDFS文件系统上存储有HBASE数据库和Solrcloud索引,图数据库引擎包括数据及索引存储层、数据库层及
4
CN 107292517 A
说 明 书
3/3页
ClientAPI层,数据及索引存储层与HBASE数据库和Solrcloud索引相连,ClientAPI层与应用层相连,应用层用于提供海量关系运算、海量检索、关系关联、手工绘制、GIS整合、实时关系运算、关系扩展、特征查询、属性收集及图分析。[0026]机器学习引擎5用于提供分析引擎3、图谱单元4在工作过程中所需的算法模型,机器学习引擎5基于spark分布式计算框架实现,其包括数据探索模块、数据预处理模块、模型训练模块、模型评估模块、模型可视化模块及模型预测模块,数据探索模块用于对数据进行分布统计、相关性分析、假设检验及核密度估计,数据预处理模块用于对数据进行清洗、转换、加载、特征提取及特征选择,模型评估模块用于对已训练好的模型进行评估,模型可视化模块用于实现模型的可视化显示,模型预测模块用于将模型固化到生产环境、实时推送预测信息以及生成分析建议报告;
[0027]查询单元6用于提供基于与、民航相关的关注要素的模糊查询和特征检索。[0028]本发明的民航安保信息服务系统还包括地图检索单元7和人工绘制单元8,其中:[0029]地图检索单元7用于提供地图级别的检索和跟踪分析,以实现重点关注人员的行动轨迹跟踪。
[0030]人工绘制单元8用于手工补充人物关系数据以及管理维护人物关系数据。[0031]以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
5
CN 107292517 A
说 明 书 附 图
1/1页
图1
图2
6