一、专卖数据融合
大数据难点不在于数据挖掘、分析,而在于如何把各种有价值的数据之间的关联关系建立起来,烟草在信息化建设中从不吝啬,持续的在信息化建设中投入大量的资金,多年的持续投入,产生了大量的结构化和非结构化的数据,这些数据分布在各个信息化系统中,但这些数据只能在各自的系统中独立使用。使用方式也是传统的查询和定制报表,无法发挥更大的作用。数据融合,首先要解决的就是建立数据汇聚的通道,把分散在各个业务环节,各个信息化系统中得关键数据采集、整合、分类,形成有价值的数据链,形成专卖的数据数据仓库,为后续的数据深入挖掘和使用提供牢固的基础。
二、推动专卖数据精细化使用
充分了利用了专卖沉淀下来的大量历史数据,依托专卖数据仓库,跨业务模块数据的使用,证件和订单、证件、案件、订单,这种数据的使用不受应用系统,不受应用模块的限制,只受限于各信息化系统产生的数据是否被融合到了专卖数仓库中。
三、非结构化数据分析
目前市场监管系统只能对结构化数据进行分析,大数据的使用分自动和手动两种,技侦百度是一种手动操作,是专卖人员输入关键信息,手工查询数据并使用数据,预警模型是系统的自动行为,是根据人为设定的预警条件,自动在专卖数据仓库中寻找、碰撞数据,自动推送给使用的专卖人员,例如我们在导入外部可获取的公安数据同时,系统会自动比对,数据中的电话号,联系方式在专卖数据仓库中是否存在主动提示。