返回首页

ai对大数据分析的冲击(大数据分析的挑战)

来源:www.xuniwu.cn   时间:2022-12-28 22:32   点击:242  编辑:admin   手机版

1. 大数据分析的挑战

一、数据核心原理

从“流程”核心转变为“数据”核心

大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需求,将改变IT系统的升级方式:从简单增量到架构变化。大数据下的新思维——计算模式的转变。

例如:IBM将使用以数据为中心的设计,目的是降低在超级计算机之间进行大量数据交换的必要性。大数据下,云计算找到了破茧重生的机会,在存储和计算上都体现了数据为核心的理念。大数据和云计算的关系:云计算为大数据提供了有力的工具和途径,大数据为云计算提供了很有价值的用武之地。而大数据比云计算更为落地,可有效利用已大量建设的云计算资源,最后加以利用。

科学进步越来越多地由数据来推动,海量数据给数据分析既带来了机遇,也构成了新的挑战。大数据往往是利用众多技术和方法,综合源自多个渠道、不同时间的信息而获得的。为了应对大数据带来的挑战,我们需要新的统计思路和计算方法。

二、数据价值原理

由功能是价值转变为数据是价值

大数据真正有意思的是数据变得在线了,这个恰恰是互联网的特点。非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。

例如:大数据的真正价值在于创造,在于填补无数个还未实现过的空白。有人把数据比喻为蕴藏能量的煤矿,煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”,价值含量、挖掘成本比数量更为重要。不管大数据的核心价值是不是预测,但是基于大数据形成决策的模式已经为不少的企业带来了盈利和声誉。

三、全样本原理

从抽样转变为需要全部数据样本

需要全部数据样本而不是抽样,你不知道的事情比你知道的事情更重要,但如果现在数据足够多,它会让人能够看得见、摸得着规律。数据这么大、这么多,所以人们觉得有足够的能力把握未来,对不确定状态的一种判断,从而做出自己的决定。这些东西我们听起来都是非常原始的,但是实际上背后的思维方式,和我们今天所讲的大数据是非常像的。

举例:在大数据时代,无论是商家还是信息的搜集者,会比我们自己更知道你可能会想干什么。现在的数据还没有被真正挖掘,如果真正挖掘的话,通过信用卡消费的记录,可以成功预测未来5年内的情况。统计学里头最基本的一个概念就是,全部样本才能找出规律。为什么能够找出行为规律?一个更深层的概念是人和人是一样的,如果是一个人特例出来,可能很有个性,但当人口样本数量足够大时,就会发现其实每个人都是一模一样的。

2. ai对大数据分析的冲击是什么

人工智能是在1956年达特茅斯会议上首先提出的。该会议确定了人工智能的目标是“实现能够像人类一样利用知识去解决问题的机器”。虽然,这个梦想很快被一系列未果的尝试所击碎,但却开启了人工智能漫长而曲折的研究历程。

  人工智能的第一次高潮始于上世纪50年代。在算法方面,感知器数学模型被提出用于模拟人的神经元反应过程,并能够使用梯度下降法从训练样本中自动学习,完成分类任务。另外,由于计算机应用的发展,利用计算机实现逻辑推理的一些尝试取得成功。理论与实践效果带来第一次神经网络的浪潮。然而,感知器模型的缺陷之后被发现,即它本质上只能处理线性分类问题,就连最简单的异或题都无法正确分类。许多应用难题并没有随着时间推移而被解决,神经网络的研究也陷入停滞。

  人工智能的第二次高潮始于上世纪80年代。BP(Back Propagation)算法被提出,用于多层神经网络的参数计算,以解决非线性分类和学习的问题。另外,针对特定领域的专家系统也在商业上获得成功应用,人工智能迎来了又一轮高潮。然而,人工神经网络的设计一直缺少相应的严格的数学理论支持,之后BP算法更被指出存在梯度消失问题,因此无法对前层进行有效的学习。专家系统也暴露出应用领域狭窄、知识获取困难等问题。人工智能的研究进入第二次低谷。

  人工智能的第三次高潮始于2010年代。深度学习的出现引起了广泛的关注,多层神经网络学习过程中的梯度消失问题被有效地抑制,网络的深层结构也能够自动提取并表征复杂的特征,避免传统方法中通过人工提取特征的问题。深度学习被应用到语音识别以及图像识别中,取得了非常好的效果。人工智能在大数据时代进入了第三次发展高潮。

3. ai大数据分析什么意思

首先,互联网大数据目前已经形成了一个庞大的生态体系,这里面既包括技术体系,也包括业务体系,涉及到的环节包括数据采集、数据整理、存储、安全、分析、呈现和应用,随着大数据不断开始落地到行业领域,大数据自身也正在开辟出越来越大的价值空间。

要想解释清楚互联网大数据,需要从多个角度来进行解读,涉及到技术体系,业务体系和发展趋势等多个方面。从技术体系结构来看,大数据的技术体系以大数据平台为核心,而大数据平台则以分布式存储和分布式计算来展开。目前大数据技术体系已经趋于成熟,基于大数据平台的生态体系也已经形成了一定的规模。大数据平台的作用就是完成大数据的技术实现,行业领域可以基于大数据平台来完成各种大数据创新应用。

从业务体系来看,大数据本身就打开了一个新的价值空间,这个价值空间就是数据价值,由于互联网本身就会产生源源不断的数据,所以大数据的价值增量也会源源不断。不同的业务体系会产生不同的数据,所以其产生的大数据价值也会有所不同。在产业互联网时代,行业领域的数据价值将逐渐得到体现。

从发展趋势来看,在产业互联网的推动下,大数据的发展趋势将逐渐向智能化领域发展,由于人工智能是大数据应用的重要出口,所以未来大数据在人工智能的发展过程中会获得越来越多的关注。

4. AI科研大数据分析

从当前大数据等技术的落地场景来看,普通人在大数据和人工智能时代,将获得三方面的体验:

第一:工作难度下降。在大数据和人工智能时代,职场人的工作难度会在一定程度上得到降低,这也是当前智能化办公的重要诉求之一。较低的工作难度能够明显提升职场人的工作效率,同时也会提升职场人的工作积极性和工作成就感。

第二:工作场景拓展。随着5G通信的落地应用,很多工作岗位的工作场景会得到拓展,比如很多岗位任务在家就可以完成,这会明显提升职场人的工作体验。实际上,当前在IT(互联网)行业内有很多工作岗位都可以在家完成。

第三:岗位附加值提升。岗位附加值的提升是职场人的重要诉求之一,更高的岗位附加值意味着更高的薪资待遇和更强的资源整合能力,这对于职场人未来的发展都有非常积极的意义。

5. 大数据分析遇到挑战

中国互联网大会正式开幕。在以《共创5G产业新未来》为主题的尖峰对话环节,中国联通副总经理梁宝俊应邀出席,并围绕5G的作用、目前5G面对的机遇和挑战等,与现场专家展开对谈,发表了精彩的观点。

4G改变生活,5G改变社会。这句话在如今愈发让人有深刻的体会。比如在疫情防控期间,广东、江西等省利用5G等新技术开展了远程会诊,为湖北的患者提供了救治服务;在近期的防汛工作中,中国联通在湖南利用5G+无人机完成了一些过去无法实现的实景勘察,避免人员受到伤害等。梁宝俊认为,在数据的洪流中,5G的作用可以被归纳为——支点性的赋能技术。在产业转型、动能转换、国家治理体系现代化过程中,5G扮演着支点性赋能技术的角色。

在梁宝俊看来,5G的作用主要体现在三方面,首先是5G特有的大带宽、低时延、广连接特性使得万物得以智联;其次,5G与人工智能、大数据、云计算等技术不断融合,将数据生产力这一要素发挥的淋漓尽致;最后,5G赋能千行百业,将应用场景通过技术的力量更好地实现其真正价值。5G服务社会、产业、民生,为社会发展做出巨大贡献。

互联网的上半场是消费互联网,下半场是产业互联网。梁宝俊相信,这一趋势将逐步得到印证。在行业不约而同的落实5G“新基建”的过程中,5G一定为成为数字经济的新一轮发展引擎,这点也得到了业界共识。

5G目前还面临着怎样的机遇和挑战?从机遇侧看,第一点,政策的支持使产业迎来机遇期。“新基建”的构建使得像中国联通这样的运营商致力于成为数字基础设施的提供者、数字经济的赋能者,国家有相关政策、社会有相关的需求,这促使产业加速转型升级,给新旧动能转换提供了很好的机遇。第二点,商业模式创新的机遇。从商业角度来看,5G的出现以支点的作用将千行百业连接起来。5G可以赋能,但并非万能,它必须与各行各业连动起来,在这个过程中,碰撞出火花,构建出新业态、新模式。第三,是技术的机遇。5G与人工智能、物联网、区块链等技术的结合,一定会产生更多模式。

从挑战侧看,首先,5G技术目前尚且不够成熟,5G R16版本近期的冻结让产业场景增添了新内容,但仍需要在实践中探索,与之相关的产业链、产品乃至行业终端,都需要过程。其次,5G的运营建设成本仍旧十分高昂。作为运营商,面临着投入收回投入的压力,本着负责任的态度,中国联通很高兴的看到,许多地方政府出台了支持政策,需要产业链通力合作,将运营建设成本降下来。最后,5G的应用融合仍存在挑战。CT企业与IT企业、OT企业如何结合,需要大家进一步探索深化。

一枝独秀不是春,万紫千红春满园。5G是大家的5G,不只是运营商的5G,中国联通自去年4月成立了5G应用创新联盟,也是希望能汇聚行业合作伙伴的力量,将生态链各方面聚合起来,成为数字经济赋能者。目前,联盟合作伙伴以近千家,中国联通在其中起到赋能的作用。“我们搭台,大家唱戏,更好的将这些资源、技术、新模式迸发出来。通过生态的打造,才能百花齐放。”梁宝俊这样总结。

顶一下
(0)
0%
踩一下
(0)
0%