正在阅读:那么问题来了 用户希望他的数据是干净的那么问题来了 用户希望他的数据是干净的

2014-12-18 00:15 出处:其他 作者:佚名 责任编辑:zhangxiaomeng
1概述,数据到底是“干净”还是“脏的”回顶部

  【PConline 杂谈】大数据和商业决策之间究竟有何关联?这个问题相信困扰着很多企业。的确,企业管理层在下达任何一个决策或指令时,都会经过深思熟虑,然而深思熟虑的背后是基于一个怎样的考虑和根据?所下的决策又会给企业带来怎样的影响?

1
那么问题来了 用户希望他的数据是干净的

  回首过去的IT模式,用户往往都是带着所遇到的问题到数据当中去寻求答案,以及可以解决问题的方法。然而随着大数据的不断发展,到今天这种模式已经颠倒过来了,数据已经能够帮我们预测很多事情,从而能帮助用户在下每一个决定之前能够信心百倍。数据对于用户决策的这种改变背后究竟是什么?本期我们就来说说。

  数据的“干净”与否

  曾经有一家美国的初创型公司,公司专注于和地理位置相关的很多数据收集、整理和查询等工作,它将地理位置的相关指标,按照酒店和旅馆等属性划分为不同细类,对外提供基于位置信息的实时查询,对于所收集来的数据会提供一个数据质量评分,以反映数据的可信度和质量水平。它会对这些数据的源头以及对处理数据阶段所用的算法进行评分。也就是说,这家公司在提炼数据的每一个阶段都进行了数据化管理。

1

  通过这家美国企业的服务模式我们不难看出,服务商其实并不是百分之百相信所收集来的数据是“干净的”,因此当企业把数据收集来之后,就会像污水处理厂处理废水一样,对海量数据进行过滤和检测,确保将这些数据变成我们所谓的真实可用的“干净数据”。

1

  事实上,我们今天在处理的大数据,依然只是冰山一角,而更大的数据都隐藏在我们的语言中,比如我们说的话和写的字。所以,将来我们要准确地从互动中抓取数据,也一定要依赖对自然语言的处理,因为基于自然语言所收集来的数据才是真正贴近用户需求的,真正可用的。>>

 

更多云计算、虚拟化、大数据行业资讯和最新技术,关注PConline企业频道云计算专区:
//servers.pconline.com.cn/cloud

 

smb-code-3

2淡化数据是必经之路回顶部

  淡化数据是必经之路

  数据其实是具有优先级的,对于数据的标准化方面,在当今的大数据时代是一个需要我们深聊的一个问题。此外,我们如何进行大数据的交换和对接,怎样在交换的同时保证数据的稳定性,也是十分重要的。

1

  此外还有诸如像数据存储方面,对于大数据的存储是现在很多企业所关心的,如何在保障大容量数据存储安全的同时,还能够对数据进行实时管理和监测,从而保障数据的时效性是现在我们面临的大数据困扰之一。

1

  美国专家曾经提出过一个理念叫数据淡化,也就是说我们现在所收集、分析、存储的海量数据都会慢慢淡化,正是因为数据是有优先级的,在数据中有些是特别核心的,有些即使缺失了也没有多大问题,所以让海量数据形成一个有层次的优先级管理模式是未来的一个重要趋势。>>

3数据“标签化”管理是什么,编辑的话回顶部

  数据“标签化”管理是什么

  数据的属性标签是人类经验判断的数据,是数据后的数据。例如,当你要为一件物品打上标签时,其实就已经动用了你的经验数据分析,并进行了归纳总结,结合当下的环境给出了判断。

1

  在数据属性的管理上,对于用户来说,每个人身上贴的标签都是多种多样的,但是对于企业来说,如何将这些标签归一,如何用一个点去将之串联,又如何把这些点连起来去描述这个用户,这才是核心问题。

1

  标签在观察之后加进平台和直接加进去是不一样的。在电商平台中,就有一些标签是在观察后加进去的,如果由卖家自由地加标签进去,必然会造成混乱。所以,标签的属性管理,在运营数据中非常重要。 

1

  标签化管理,是一个非常重要的趋势。电商企业今天面对的一些问题在美国的电商企业中同样存在,属性管理的层级化十分有必要,但是在使用数据前,必须要了解数据的场景、数据是如何放进去的和数据的场景是什么。

  编辑的话

  有很多业内专家表示,未来是“人机合一”的时代,对于大数据的收集和管理,在模式上已经和以前有了很大区别。对于企业来说,在确保能够收集海量数据的同时,将数据的时效性大大提升,才是真正能满足用户需求的有效途径。[返回频道首页]

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
IT热词
热门排行

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品