大数据安全分析07_大数据存储技术介绍 2024-05-03 12:18:31 鉴于网络安全数据组成的复杂性、规模,以及对实时搜索响应的需求,需要通过大数据存储集群快速实现空间的扩容,在PB级的安全数据中做到安全分析查询的秒级响应,同时需要为数据提供了冗余机制,保障数据的安全。 ▼▼Hbase Hbase是一个提供高可靠、高性能、可伸缩、实时读写、分布式的列式数据库,主要用户存储非结构化的松散数据。Hbase与传统关系数据库的一个重要区别在于,它采用基于列的存储,而后者采用基于行的存储。Hbase具有良好的横向扩展能力,可以通过不断增加廉价的商用服务器从而提高存储能力,也可以处理非常庞大的表。HDFS为Hbase提供可靠的底层数据存储服务,MapReduce为Hbase提供高性能的计算能力,Zookeeper为Hbase提供稳定服务和Failover机制,因此我们说Hbase是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案。Hbase适合存数据,但对于模糊匹配查询不擅长,且不适合高并发查询,它比较适合的场景为:存数据量巨大(百T、PB级别),但查询简单,数据不涉及到复杂关联。 ▼▼Mongo DB MongoDB数据库是一个高性能、非关系型的开源文档型数据库,在当前分布式数据库产品使用中最为流行。MongoDB支持松散的数据结构,使用文档型的存储方式,可以存放比较复杂的数据类型。Mongo DB最大的特点是存储的内容是文档型的,不需要固定的表结构也可以对指定字段建立索引,实现关系型数据库的功能。由于MongoDB的数据结构非常简单,所以它的读写性能也非常高,当数据量达到50GB以上时,Mongo DB数据库的访问速度是My SQL数据库的10倍以上。但是MongoDB存储的数据量达到10亿级别后,性能会有明显的下降,除非另外分库。 ▼▼ElasticSearch ElasticSearch和Hbase、MongoDB一样,是非关系型数据库。ElasticSearch是基于全文搜索引擎(Lucene)构建的开源、分布、RESTful搜索引擎,是优秀的全文检索和分析引擎。ElasticSearch主要是基于高性能数据存储系统构建,集海量异构数据分析处理、元数据提取、索引数据统一构建管理、通用化检索接口于一体,系统由分布式的全文搜索引擎和海量数据索引服务组成。针对海量异构数据进行预处理解析后形成构建索引的元数据,对元数据分析后,根据其特性形成索引映射机制,提取构建索引结构数据,并提供持久化机制。以统一的索引资源池为基础,屏蔽异构数据的复杂性,提供统一检索服务。ElasticSearch在解决大数据相关问题中有良好的表现,随着日志事件搜索量的增加,搜索反应时间不线性增加,说明基于ElasticSearch的大日志实时搜索的软件集成方案设计具有可行性。ElasticSearch是一个接近实时的搜索平台,各项数据显示ElasticSearch适合数据分析、数据统计中较其他软件具有明显的优势。扩展 · 本文相关链接· 大数据安全分析06_数据解析技术 · 大数据安全分析05_数据采集技术 · 大数据安全分析04_数据传输方式 · 大数据安全分析03_数据采集对象与数据类型 · 大数据安全分析02_大数据安全分析技术框架 · 大数据安全分析01_为什么要用大数据技术进行安全分析? 赞 (0) 相关推荐 MongoDB 面试问题 介绍 mongoDB 是一种文档性的数据库.文档的数据库,即可以存放xml.json.bson类型系列的数据. 这些数据具备自述性(self-describing),呈现分层的树状数据结构. ... 2021年推荐使用的十大数据库 MySQL,Oracle,PostgreSQL,Microsoft SQL Server,MongoDB,Redis,Elasticsearch,Cassandra,MariaDB,IBM Db2 & ... mongo shell mongo shell mongo 连接 本地 mongo # 连接127.0.0.1:27017 远程 mongo "mongodb://mongodb0.example.com:2801 ... 大数据安全分析02_大数据安全分析技术框架与关键技术 大数据分析通过对安全告警.系统日志以及网络流量等海量多源异构数据进行采集.存储与分析,打破原有网络安全烟囱式防护模式,将所有安全防护措施与安全数据打通,解决网络安全防护孤岛和数据孤岛问题. 大数据分析 ... 大数据安全分析08_大数据处理框架介绍 大数据安全分析需要支持对接分布式数据库进行离线批处理分析,来实现长周期的网络安全.用户行为.业务安全分析,所以大数据平台首先需要支持批处理模式. 网络流量产生的实时数据往往是高吞吐量的,一个小型Mbp ... 大数据安全分析06_数据解析技术 由于网络空间态势感知的数据来自众多的网络设备,其数据格式.数据内容.数据质量千差万别,存储形式各异,表达的语义也不尽相同. 如果能够将这些使用不同途径.来源于不同网络位置.具有不同格式的数据进行预处理 ... 大数据安全分析01_为什么要用大数据技术进行安全分析? 关于安全运营系列文章,在2020年10月份写了篇<安全运营的定义与核心目标>,算是开了个头.后面几个月由于精力不够,内容方向也没有想清楚,就一直没有继续写. 安全运营的范围太大了,还是觉得 ... 大数据安全分析05_数据采集技术 大数据分析中的数据采集方式包括Logstash.Flume.Fluentd.Logtail等,本文对这几种数据采集技术进行简要介绍. Logstash Logstash是一个具备实时处理能力的开源的数 ... 大数据安全分析09_关联分析简介 大数据关联分析提供了基于规则.基于统计的关联分析功能,能够实现对于安全事件的误报排除.事件源推论.安全事件级别重新定义等效能. ▼▼关联分析简介 关联分析是在大规模数据集中寻找有趣关系的任务.这些关系 ... 大数据安全分析10:复杂事件处理(CEP)简介 复合事件架构是由史丹佛大学的David Luckham与Brian Fraseca所提出,使用模式比对.事件的相互关系.事件间的聚合关系,目的从事件云(event cloud)中找出有意义的事件,使得 ... 大数据安全分析04_数据传输方式 大数据分析中数据传输方式包括SYSLOG.kafka.JDBC/ODBC.文件或FTP.Agent等方式,本文对数据传输方式进行简要介绍. SYSLOG syslog日志消息既可以记录在本地文件中,也 ... 大数据安全分析11:复杂事件处理(CEP)引擎简介 目前已有的CEP引擎根据事件处理语言可以分为两大类:面向流和面向规则的CEP引擎. 面向流的CEP引擎有Microsoft Streamlnsight.Oracle CEP.IBM SPADE.Esp ...