Skip to main content

 路由器设置 > 新闻资讯 >

大数据时代下的人工智能

2013-12-05 23:57 浏览:

  人工智能,从其概念被提出到现在,已经过了几十年。事实上,按照人工智能学者当年的承诺,接近人类智能的人工智能早就被开发出来了,然而现实并非如此,人工智能的研究停止了很长一段时间,期间遇到了许许多多的困难。至今,人工智能的科学研究者还是取得了不少的成就,在如今的大数据时代,人工智能又将写下怎样的篇章?

  我们可以很自信的说,人工智能的逻辑推理方面我们已取得很好的成果,具有很强的逻辑推理能力的机器可以准确判断一位病人的状况,也可以很容易打败一位国际象棋高手,甚至可以做出很好的指挥整个系统。通过改进算法之后我们可以使机器逻辑推理能力变得更强,完成人类智能难以完成的任务,然而,这种强悍的逻辑推理能力却往往局限限于很小的范围,超出了这个范围就很难得到预期的结果,当然,这个结果可能是十分荒谬的。更令人难受的的是这种逻辑推理能力是基于人们事先输入的大量规则或进过无数次的人工训练,也就是说这种逻辑推理能力是基于人们总结出来的知识。经过几十年的研究我们逐渐认识到,仅仅具有逻辑推理能力是很远远无法实现人工智能的,我们希望机器具有智能,就必须设法使机器具有学习能力,于是我们便提出了机器学习。其实,早在1950年图灵提出的图灵测试的文章中就提到了机器学习的可能,之后便就有了机器学习的相关研究。现在,我们不得不赞美这位伟大先贤的准确的预见性,与此同时,机器学习的研究如火如荼的展开了。

  随后是出现了各种各样的机器学习方法,研究者从归纳学习、决策树学习、类比学习和解释学习中寻找思路,当然,不少研究成果也着实令人兴奋。谈到其中的成果,不得不提到神经网络学习算法,在当时,这种算法迅速流行,很多关于神经网络学习算法的应用也都取得了极大的成功,当然,在今天,这种算法也常为实际工程应用采用。20世纪90年代,统计学习站在了机器学习舞台的中央。一方面是连接主义学习技术的局限日渐出现,另一方面是概率论与数理统计学科的充分发展,统计学习得到了人们的关注。统计学习从一些样本出发得出目前不能通过原理分析得到的规律,利用这些规律去分析客观对象,对未来数据或无法观测的数据进行预测。

  然而,对于这些研究成果我们并不感到满足,并不仅仅是因为人们都追求完美,而是这些研究成果在处理“大数据”时已渐现能力不足,在大数据时代的今天我们迫切希望能找到新的成果。最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。“大数据”给人工智能同时带来了新的挑战和新的方向,这也是无法回避的。

  1.新的挑战

  数据正在迅速膨胀并变大,机器如何从海量的数据中找到有价值的信息?不难发现,之前的很多人工智能研究都是基于一定范围的少量数据,于是,这样的研究成果我们很难直接用于处理大数据信息,用于处理大数据,效果可能很差,甚至根本无法运用。比如,在海量的数据面前,建立决策树几乎是不可能的,决策树学习难以派上用场,对于大型计算机来说复杂度为O(n2)的算法都可能运算很久,这样的消耗这是很难让人容忍的。

  2.新的方向

  在巴拉巴西(Albert-LászlóBarabási)的新书《爆发:大数据时代预见未来的新思维》中,他试图回答了这样一个问题:人类的行为是否可以被预测?这位美国物理学院的院士巧妙地把历史和数学结合起来,有趣地回答了这一问题:

  “在人类漫长的历史中,人类的行为并不是随机的,并不是泊松分布的,而是存在一定的规则。通过对大数据的分析,可以看到人类的行为规则是基于优先级排布的问题。每个人都有自己的任务列表,而如何按照优先级排列顺序则产生了不同的影响。

  从这里我们至少可以知道,大数据中可能存在着某种可被我们发现的规律,也就是说,大数据的处理是可能的。数据挖掘就是试图从海量数据中找到有用的知识,机器若能从海量数据中发现知识并将其应用于逻辑推理,这种机器学习方法便能实现完全意义上的人工智能,在这里我们似乎都看到了完全意义上的人工智能实现的可能。下面就是一个这样的例子:

  谷歌有一个名为“谷歌流感趋势”的工具,它通过跟踪搜索词相关数据来判断全美地区的流感情况(比如患者会搜索流感两个字)。近日,这个工具发出警告,全美的流感已经进入“紧张”级别。它对于健康服务产业和流行病专家来说是非常有用的,因为它的时效性极强,能够很好地帮助到疾病暴发的跟踪和处理。事实也证明,通过海量搜索词的跟踪获得的趋势报告是很有说服力的,仅波士顿地区,就有700例流感得到确认,该地区目前已宣布进入公共健康紧急状态。

  事实上,随着云计算的发展,数据存储的能力得到了极大地提高,无论是科学研究还是社会生活的各个领域都积累了大量的数据,对这些数据进行分析以发掘数据中蕴含的有用信息,成为了几乎有领域的的共同需求。正是种大趋势下,机器学习和数据挖掘技术作用日渐重要,并受到了广泛的关注。大数据面前,要实现机器学习就必须从海量数据中找到有用信息,并转化为可被机器利用的知识,即要从海量数据中发现知识。从中我们可以发现,在大数据面前,知识发现和数据挖掘有很多相同之处,也因此,一般场合下这两者概念上可以互换。

  大数据时代下,旨在从互联网时代非结构化数据的庞大“宝藏”中获得知识和洞察力的计算机工具正在迅速发展中。在这种工具发展的最前沿是迅速取得进步的人工智能技术,比如说自然语言处理、模式识别等。谷歌的搜索和广告业务及其实验中的机器人汽车都利用了很多的人工智能技术。在加利福尼亚州的公路上,谷歌的机器人汽车已经跑了数千英里的路,这要求机器人对数量庞大的数据进行分析,并在瞬间做出决策。

  大数据时代下快速而准确地处理大量数据能力的人工智能已经实现,我们相信大数据下人工智能将会得到长足的发展,更多的成果将会出现在我们面前。与人类同等水平的智能就快要实现,而这一刻就在不远的将来。

  部分参考自《大数据时代的人类行为预测》、《爆发:大数据时代预见未来的新思维》