主页 > 时评数码 >机器学习举一反三(1-2) >

  • 机器学习举一反三(1-2)


    2020-07-17


    機器學習舉一反三(1/2)

    科学家长期研究人类的学习方式,以教导电脑如何学习。现在运用贝氏推论的人工智慧,仅需数个範例就可辨识图形,表现堪比人类。


    重点提要

    孩童如何从有限资讯学习新的知识?历代哲学家都在思考此问题,现在资讯科学家和心理学家也想知道答案。人工智慧(AI)专家正在研究孩童的推理能力,想要发展出能教导电脑认识这个世界的方法。两种不同的机器学习策略都试图模仿人类的学习方法,这项趋势已经开始改变AI这门领域。

    如果你常常跟孩童在一起,一定会好奇他们怎幺能既快又广泛学习新事物。历代哲学家(一路回溯至柏拉图)也想知道缘由,但一直没有找到满意的答案。我的五岁孙子奥吉已经学习不少关于植物、动物和时钟的知识,更不用提恐龙和太空船。他也能理解其他人的需求、想法,以及有何感觉。他可以依据这些知识,把看到和听到的事分类,并做出新的猜测。举例来说,他最近认为美国纽约市自然史博物馆展出的新发现物种泰坦巨龙(titanosaur)只吃植物,换句话说,牠其实没有那幺吓人。

    奥吉从环境中感受到的是一连串撞击他视网膜的光子,以及振动他耳膜的空气分子。但在他蓝色眼珠后方的神经电脑,能设法从他感官获取的有限资讯,做出关于草食性泰坦巨龙的猜测。我们不断在思考一个问题:电脑能否像孩童那般既快又广泛学习新事物?

    15年来,资讯科学家和心理学家努力想找到答案。孩童仅凭着教师或父母灌输有限的资讯就能获得大量的知识。儘管智慧机器已突飞猛进,但效能最强大的电脑的学习效率还是无法媲美五岁孩童。

    了解孩童大脑实际上如何运作,然后创造出同样有效率的智慧机器,是资讯科学家在未来几十年要面对的挑战。但此刻,他们正在发展的人工智慧(AI),已经纳入一些我们对于人类学习方式的认知。

    复兴人工智慧

    1950~60年代AI爆发第一波热潮后,发展停滞了几十年。不过近几年AI展现惊人突破,特别是机器学习,而AI也成为科技界最热门的领域。关于这些进展所代表的意义,人们衍生了很多乌托邦或末日论的预测。说穿了,这些预言不是提到永生,就是世界毁灭,很多则是同时提到这两种可能性。

    我猜AI的发展会引起如此强烈的情绪,是因为我们由衷恐惧机器变得太像人。从中世纪的泥人传说到科幻小说《科学怪人》,乃至电影「人造意识」性感的女机器人艾娃,人类有一天或许会创造出跟自己没有什幺差别的人造物的这种想法,总教人深感不安。

    但电脑真的可以像人类那样学习新事物吗?这些情绪强烈的预测,有多少指出革命性的改变,又有多少只是夸大之词?电脑如何学会辨认猫、语音或日文字,其中的细节可能难以理解,但进一步观察机器学习背后的基本概念,就会发现其实不像一开始那样令人费解。

    解决上述问题的方法之一,是从奥吉或我们任何一人接收到的一连串光子与空气分子着手,不过传送给电脑的是数位影像的像素以及录製的声音样本。电脑会从数位资料中找出一连串模式,以侦测或辨认周遭世界里完整的物体。这种所谓由下而上(bottom-up)的方法源自许多人的想法,例如哲学家休姆(David Hume)、弥尔(John Stuart Mill)和心理学家巴佛洛夫(Ivan Pavlov)、史金纳(B. F. Skinner)。

    1980年代,科学家想到强而有力且巧妙应用由下而上的策略,让电脑从资料中寻找有意义的模式。联结论(connectionism)或人工神经网路系统的研究人员从神经元的运作机制汲取灵感,神经元会把视网膜上的光转换成周遭世界的影像。人工神经网路採取类似做法,使用相互连结的处理元件(模仿神经元),在逐层分析资料时,把某一层的像素转换成越来越複杂的影像,例如鼻子或整张脸。

    拜深度学习(deep learning)这项新技术之赐,人工神经网路的概念在最近有复兴之势。如今,Google、脸书与其他科技巨擘已经把深度学习运用到商业行为中。一如摩尔定律的预测,电脑的运算能力不断呈指数增加,也促成了这些新系统,而庞大资料集的发展也有贡献。在联结论系统具备更好的处理能力和更多可分析的资料后,学习效率比我们以前认为的还要高。

    多年来,对于机器学习应该採取这种由下而上的方式,还是另一种由上而下的方法,AI社群一直摇摆不定。採取由上而下的方法,电脑就能依据既有的资讯来学习新事物。柏拉图以及所谓的理性主义哲学家例如笛卡儿(Rene Descartes),相信人类是採取由上而下的方法来学习,而这种方法在早期AI的发展中也扮演重要角色。2000年代,这类方法也以机率或贝氏(Bayesian)模型的型式重生。

    就像科学家一样,採取由上而下方法的电脑,一开始会先对世界建构抽象又广泛的假设。如果假设正确,电脑会预测资料的模式。然后电脑也像科学家一样,会根据预测结果修正假设。

    机器学习举一反三(1/2)

    由下而上

    由下而上的方法或许是最容易理解的,所以先说明这种方法。假设你想要电脑区分电子邮件信箱里的邮件和诈骗信,你可能会注意到诈骗信有一些容易辨别的特徵:一长串收件人地址、奈及利亚或保加利亚的发信地址、信里会提到百万美元奖金或威而钢。但非常重要的邮件可能看起来也一模一样,你一定不想错过自己获得晋升或学术奖项的通知。

    一旦你比较了够多的诈骗信和其他类型的邮件,你可能会注意到只有诈骗信显露某些特徵。例如,奈及利亚配上百万美元奖金的邮件,就代表是诈骗信。事实上,要区分诈骗信和重要邮件,或许有一些更细微、高阶的模式,例如拼错字和IP位址,但两者一点也不明显。如果你找到这些特徵,就能正确过滤出垃圾邮件,而不用担心错过「你的威而钢已寄出」的通知邮件。

    採取由下而上方法的机器学习可以找出相关线索,解决这类任务。为了做到这点,人工神经网路必须进行学习过程。把庞大资料库里几百万笔例子输入电脑,每笔例子都标示一般邮件或是诈骗信,然后电脑会撷取出一组可分离出垃圾邮件的辨识特徵。

    同样地,人工神经网路也能检视网路上标示猫、狗或剑龙的影像,在每组影像中撷取共同特徵,得以把猫和其他影像区隔开来。之后人工神经网路就能辨识猫的影像,即使那是从未见过的新影像。

    其中一种由下而上的方法,称为「无监督学习」(unsupervised learning),虽然还在相对初期的发展阶段,但可以从毫无标示的资料中找出模式。电脑会寻找影像中可辨识物体的整组特徵,举例来说,一张脸总是有鼻子和眼睛,而且与背景中的树和山不同。这些先进的深度学习网路透过逐层分析来辨识物体,而辨识任务在不同层中会转换输入。

    2015年,发表在《自然》期刊的一篇论文,阐释由下而上方法的进展。深度心智(DeepMind)是Google创立的一家公司,研究人员结合了两种由下而上的技术:深度学习与「增强学习」(reinforcement learning),让电脑精通一款名为雅达利(Atari)2600的电玩游戏。电脑一开始对游戏的运作方式一无所知,採取的策略是随机猜测最佳玩法,同时不断接收玩法结果的回馈。深度学习帮助电脑辨识萤幕上的特徵,增强学习则因电脑获得高分而奖励它。电脑在好几款游戏上都达到熟练程度,在某些游戏中的表现还赢过人类专业玩家。不过,对于人类轻易就能够精通的一些游戏,电脑则完全没辄。

    我们让AI透过庞大资料集学习,例如数以百万的Instagram影像、电子邮件讯息或语音档案,在过去几度让人气馁的问题上获得解决方案,例如影像或语音的辨识。然而,我的孙子奥吉没有接收那幺多的资料并进行训练,却轻易就能认出动物或回应别人的发问。五岁孩童能够轻易解决的某些问题,对电脑来说依旧十分费解,难度也远超过下棋。

    电脑通常要接收几百万个範例,才能辨识满是络腮鬍的脸孔影像,而人类只需要一些例子就能办到。电脑经过密集训练后,或许能辨识从未见过的猫的影像,但是辨识方法和人类的类化(generalization)很不一样。因为电脑软体採用不同的推论方式,有时会发生失误。有些包含猫的影像却没标记猫,电脑也可能误指某个影像是猫,不过那其实只是杂乱的模糊影像,人类则不会出这种洋相。(待续)



    上一篇:
    下一篇: