大数据时代!如何正确认识大数据?

在现在的数据技术时代中,数据有着不可替代的地位,抛开数据谈大数据服务就是瞎扯,没有数据作支撑的大数据平台就是一个空壳,数据是一切数据分析、数据挖掘、大数据处理、ai算法的核心,在目前的来看,绝大多数公司或者组织做大数据处理时,他们的数据来源于:设备收集、数据库、日志、爬虫等等。当然如果是学术或者个人做大数据处理的研究的话,数据还经常可能来源于:开源数据集、造数据等等。这很好理解,因为在公司中,常常数据都是需要服务于真实业务,所以数据也就来自于真实业务,而个人或者学术上可以使用一些特定的开源数据集来做相应研究,下面我们来介绍一下公司中经常获取数据的这几种方法!

大数据时代!如何正确认识大数据?

1.设备收集

设备收集顾名思义就是使用一些设备来进行收集数据,比如在工业界电力行业常用的Scada数据就是通过常用的一些终端电子设备,直接放在汇流箱、逆变器等设备上,实时将电流电压数据记录并保存下来,这样得到大量的数据,再如,我们每个人的手机可能都是某些软件的数据收集终端,我们每天的运动步数可能会被支付宝/微信记录下,我们每天点开软件的次数等等这些操作,都是各个软件收集数据的一个手段。这些数据可以直接放入到大数据环境当中,也可以通过关系型数据库做一个跳板。


大数据时代!如何正确认识大数据?

2.从数据库导入

在大数据技术风靡起来前,关系型数据库(RDMS)是主要的数据分析与处理的途径。许多公司的业务逻辑数据都是存放在关系型数据库中。比如一个电商网站,你购买了一件商品,发生的这种行为绝对会生成一条数据在数据库中,比如你收藏了一件商品、退货了一件商品等等这种行为都会被记录到数据库中。发展至今数据库技术已经相当完善,当大数据出现的时候,行业就在考虑能否把数据库数据处理的方法应用到大数据中。


大数据时代!如何正确认识大数据?

3.日志导入

日志系统将我们系统运行的每一个状况信息都使用文字或者日志的方式记录下来,这些信息我们可以理解为业务或是设备在虚拟世界的行为的痕迹通过日志对业务关键指标以及设备运行状态等信息进行分析。

除了常规记录的方式收集日志之外,一般用户的一些行为日志收集的方式我们采用埋点的形式进行收集,埋点的意思实际上是在前端页面上放上一个监控点,它能够记录下你所有的一些行为,比如你鼠标来来回回移动了几下,你点击了哪些地方,你在这篇文章上停留了多久,你在输入框中输入了什么字然后又删除了等等所有的一些行为,都可以被埋点所记录,而将日志数据导入到大数据环境中也有许多的方案,常见的日志收集解决方案如ELK搭建日志采集+日志查询+可视化系统。

展开阅读全文

页面更新:2024-05-16

标签:数据   终端   数据处理   学术   关系   方式   数据库   业务   时代   商品   数码   设备   系统   信息   公司   日志   软件

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top