主页 > 时评数码 >机器学习举一反三(2-2) >

  • 机器学习举一反三(2-2)


    2020-07-17


    機器學習舉一反三(2/2)

    科学家长期研究人类的学习方式,以教导电脑如何学习。现在运用贝氏推论的人工智慧,仅需数个範例就可辨识图形,表现堪比人类。

    (续前文)

    由上而下

    另一种机器学习的方法,在近几年改变了AI的发展,运作方式刚好相反:由上而下。我们假设人类可以从实际资料里获得抽象知识,因为人类已经知道很多事,更是因为大脑已经了解基本的抽象概念。就像科学家一样,我们可以藉由这些概念建构关于这个世界的假设,如果假设正确,就能预测资料(事件)的样貌;相较之下,採行由下而上方法的AI会设法从原始资料中撷取出模式,做法南辕北辙。

    要说明这个概念,可讨论上述泛滥成灾的诈骗信,这回谈一件跟我有关的真实案例。我先前收到某期刊编辑寄来的电子邮件,那份期刊名称奇怪。编辑明确提到我的一篇论文,并提议我写篇论文发表在这本期刊。这封电子邮件中没有提到奈及利亚、威而钢和百万美元奖金,没有诈骗信共同的特徵。但我依据已经知道的资讯,并且抽象思考诈骗信的产生方式,可以判定这封电子邮件很可疑。

    首先,我知道诈骗信发送者骗取他人钱财的手法是基于人类的贪婪;学术圈人士对发表论文的渴望,可能跟一般人对百万美元奖金或性能力的渴求一样强烈。其次,我知道「开放取用」期刊已经开始向作者收费来分担成本,而非向订阅者收费。另外,我的工作跟期刊名称完全不相干。综合以上因素,我提出合理假设:这类电子邮件想让学术圈人士误以为只要付费给「假」期刊就能「发表」论文。我从单一例子就得出这项结论,而且还能进一步测试自己的假设:透过搜寻引擎查询这位编辑是否真有其人。

    资讯科学家会说我的推论过程是「生成模型」(generative model),生成模型能描绘抽象概念,例如贪婪与欺骗。同样的模型也可以描述提出假设的过程,这个推论过程得出这封邮件可能是诈骗信的结论。运用这个模型,我能假想这种类型的诈骗信如何运作,也能揣测其他类型,即使是我从未看过或听过。当我收到这个期刊寄来的电子邮件,便能反向运用这个模型,一步步追查这封邮件的真伪。

    1950~60年代第一波AI和认知科学的发展中,生成模型至关重要,但也有局限。首先,原则上我们可以用各种不同的假设来解释大多数证据模式;就我的例子而言,即使那封邮件看似诈骗信,但也可能不是。于是,生成模型必须纳入机率概念,而机率是这些方法近来最重大的进展之一。其次,我们通常不知道那些构成生成模型的基本概念出自何处。笛卡儿与乔姆斯基(Noam Chomsky)这类学者指出,你天生就拥有这些概念,但你一诞生在世上时就知道他人如何凭藉贪婪和谎言来诈骗?

    贝氏模型是近来由上而下方法的绝佳範例,试图处理这两个问题。贝氏模型是以18世纪统计学家兼哲学家贝兹(Thomas Bayes)为名,利用一种称为贝氏推论(Bayesian inference)的方法,结合生成模型与机率论。机率生成模型可以告诉你,如果某个假设为真,你看到特定模式资料的机率有多高。如果某封电子邮件是场骗局,可能就是基于收件者的贪婪。不过,基于贪婪的电子邮件不一定是诈骗信。贝氏模型结合你提出假设所依据的知识以及你手上的资料,让你精準计算某封电子邮件是诈骗信的机率。

    比起由下而上的方式,这种由上而下的方式更符合我们对孩童学习方式的认知,这就是为什幺过去15年我和同事一直採用贝氏模型来研究他们的学习方式。我们与其他实验室都使用这些技术来了解孩童学习的因果关係,预测他们如何与何时会萌生出关于这个世界的新想法,以及何时会改变既有的想法。

    贝氏方法也是教导机器像人一样学习的绝妙方式。2015年,美国麻省理工学院(MIT)的特南鲍姆(Joshua B. Tenenbaum)和纽约大学的雷克(Breden M. Lake)等人在《科学》期刊发表研究,设计了一套可以辨识手写字的AI系统;人类可以轻易办到这件事,对机器来说却非常棘手。

    试想你的辨识能力,即使你从未看过日文捲轴上的字,大概也能分辨不同捲轴上的文字是否相同。搞不好你还可以写出日文字,甚至设计出假的单字,并且知道日文与韩文或俄文大相逕庭。这正是特南鲍姆的团队要让AI做到的事。

    如果採用由下而上的方法,电脑要接收成千上万的範例,从这些範例中找到模式,藉由模式辨识新的字。相较之下,贝氏方法则给电脑一个如何写字的通用模式,举例来说,一画可能是往左或往右。电脑在处理完一个字后,会接续下个字。

    当电脑看到一个字,会推论这个字的笔画顺序,接着产生一套类似的笔画,这就像我推论那封疑似期刊诈骗的电子邮件所採取的一连串步骤。特南鲍姆的方式不是推论那封电子邮件是否可能来自诈骗管道,而是猜测特定的笔画顺序是否可能写出相符的字。在同样的资料上,採用由上而下方式的电脑会表现得比深度学习更好,也更接近人类表现。

    巧妙结合两种方法

    这两种主要的机器学习方法:由下而上与由上而下,优缺点恰能彼此互补。利用由下而上的方法,电脑一开始不需要对猫有任何了解,但它需要大量的资料。

    採用贝氏模型的电脑可以从少数範例中学习,而且能更广泛推论。不过採行这种由上而下的方法,事先需要做很多功课,才能提出一套正确的假设。两种系统的设计者可能会遇到类似的障碍:只能处理範围相对较小、定义明确的问题,例如辨识手写字、猫或玩雅达利的电玩游戏。

    孩童面临同样的限制,却游刃有余。发展心理学家已经发现,不知为何,孩童会结合各种方法的最佳特色,并发展出新的方法。奥吉可以仅靠一两个例子就学到知识,由上而下的系统也是如此。但不知为何,奥吉也会从资料本身撷取新的概念,就像由下而上的系统一样,即使那些概念一开始并不存在。

    事实上,奥吉不只能办到这些事。他很快就认得猫与区别字母,但他也能做出有创意又令人惊喜的新推论,这些推论已经超出他的经验或背景知识。他最近就解释,如果大人想要再次变成小孩,应该不要吃任何有益健康的蔬菜,因为蔬菜会让小孩长成大人。这种创意推理是从哪里冒出来的,我们几乎毫无头绪。

    当我们听到有人主张AI是一种「存在威胁」时,我们应该想起人类大脑依然神秘的力量。AI和机器学习听起来很吓人,就某些方面来说确实如此。军方正在研究使用这些系统来控制武器的方法;人类的愚蠢相较AI可能造成更多破坏,我们必须比以前更有智慧,才能适当管理这些新科技。

    摩尔定律是一大影响力:即使资讯科技的进步是基于资料量和电脑处理能力的大幅增加,而不是我们对心智的了解有观念上的突破,但这些进展日后依然会有重大成果。儘管如此,我们也不应该认为新的科技泥人会有如脱缰野马在世上横冲直撞。(完)



    上一篇:
    下一篇: