贺!!本院师生于《科技大擂台:与AI 对话》竞赛夺冠!!

  • 张贴人:Ruling Digital
  • /公告日期: 2019-05-20
 

语音技术为AI的核心,今日的AI可以理解人类语言到甚么地步呢?为了鼓励了中文语音AI技术的开发,科技部举办了AI竞赛《科技大擂台:与 AI 对话》,可说是有史以来第一场AI的中文听力理解能力测验,这个比赛从 2018 3 月开始,一直到 2019 3 月结束,比赛期间长达一年,一开始共计143组队伍报名,700 馀人参赛,经历六次初赛、复赛会前赛、复赛的层层塞选,最后总共9组队伍进入决赛,最终由本校电机资讯学院师生所组成的团队夺冠(成员依姓名笔划如下:李宏毅教授、吴宗翰、陈延昊、陈缊侬教授、黄兆纬、、刘记良、刘浩然、钱柏均、谢濬丞)

科技大擂台在比什么

读者可以想像《科技大擂台:与 AI 对话》这场比赛就是机器的中文听力理解能力测验,首先机器会听到一段语音,可能是两人间的对话、广播新闻、甚至是小说朗读,内容几乎没有限制,甚么样内容都可能被拿来出题,接下来由人类询问问题,机器给出答案。回答有两种形式,在「选择题」中,机器会有四个选项,只需要选出正确的选项即可;在「简答题」中,机器必须自己以文字输出答案,挑战非常大,不过只有决赛有出现简答题。

比赛又分为线上赛和现场赛。初赛和复赛会前赛是线上赛,在线上赛中参赛队伍可以在比赛前一晚取得音档,也就是说参赛团队有一个晚上的时间可以根据音档内容客制化使用的AI技术,隔天上午比赛开始时会取得问题和选项,取得问题和选项后,机器有一个小时可以作答,需要在一个小时内上传机器作答的结果,每次比赛问题都至少有上千题,人类绝不可能在时限内完成,但机器可以办到,每次比赛总共有五次上传的机会,可以即时知道在所有参赛队伍中的排名,过程非常刺激(在比赛过程中主办单位有跟拍部分团队制作成纪录片)

复赛和决赛是「现场赛」,参赛团队将程式布署在主办单位的机器上,主办单位将叙述、问题、选项的音档一题一题地传给参赛团队的程式,参赛团队的程式需要在时限内传回答案,就跟在考听力理解测验是一样的,在复赛时主办单位甚至邀请三位人类考生和机器同台较量。现场赛对参赛团队来说是极大的挑战,一般在进行机器学习比赛时,因为有不只一次机会,所以一次上传结果不好,通常可以调了参数、换了模型再试,但是现场赛布署完后就不能再更动程式,因此只有一次机会而已,跟一般机器学习的比赛相比挑战更大,不过也更接近真实的应用情境。

要让机器去考听力测验,参赛团队至少需要具备以下两项技术:

(1)     语音辨识:机器必须要能将听到的语音转成文字。

(2)     语意理解:机器必须要理解语音辨识系统辨识出来的文字内容,才能根据问题找出文章中的答案。

以下分别概述台大团队在上述两项技术上所做的成果。

 

语音辨识

 

在这次比赛中,为了让参赛团队有大量语料可以训练语音辨识系统,主办单位和公共电视台、国立教育广播电台、均一教育平台、政大之声等机构合作提供了将近 2,000 小时的节目内容做为训练语音辨识系统的语料数据库。虽然市面上已经有不少商用语音辨识系统,但根据赛制和题目的设计,有自建语音辨识系统技术的团队会佔有优势,因此在比赛中,台大的团队还是使用自己开发的语音辨识系统。

在初赛中,有几次音档的内容较难辨识,例如当音档的内容是章回小说的朗读时,因为章回小说的用词和句法跟现代的白话文有所不同,一般商用的语音辨识系统辨识章回小说的内容其正确率会是非常低的,需要有自建语音辨识系统的能力针对章回小说客制化语音辨识系统,才有可能得到较为准确的辨识结果,因此没有自建语音辨识技术的团队很容易在初赛时就被淘汰。虽然在现实的应用上大概是没有甚么机会需要辨识章回小说,不过同样的客制化语音辨识系统的技术也可以拿来用在辨识其他带有大量专业词汇的音档上,例如:法庭攻防的录音、医病的对话、专业课程录音等。

 

语意理解

光是可以把语音辨识为文字,只完成了挑战的一半,接下来机器必须要知道文字背后的语意,才能根据问题产生答案。台大团队完全采用深度学习技术来让机器理解文字并进而得到答案,我们训练了一个类神经网络,只要输入音档的语音辨识结果、问题、选项,这个类神经网络就会输出它认为答案是四个选项中的哪一个。类神经网络的学习需要大量的练习题,练习题中需要包含音档、问题、选项以及正确答案,学习的过程完全是自动的,并不需要使用人力撰写程式教机器要如何答题,也不需要人工输入人类语言的文法规则,而是让机器根据人类提供的练习题自己找出答题的方式。在上述的学习方法中,练习题的数量决定了类神经网络答题的正确率,所以台大团队花费大量资源寻找可用的练习题,例如:蒐集国中小阅读测验的试题、购买人类在考的中文听力测验考古题等。

 

结语

最终本校电资学院的团队于决赛的 1000 题选择题中得到 53.7%的正确率,夺得本次比赛的冠军,展现了电资学院多年来在AI领域卓越的研发和教学成果。

 
照片说明:台大电机资讯学院团队上台领奖照片。(照片来源: 科技大擂台计画办公室)
首图照片说明:比赛题目中的一题。文章内容和问题都是以语音的形式传给机器,机器没有看到出现在萤幕上的文字。(照片来源: 科技大擂台计画办公室)
最后修改时间: 2019-05-20 08:00:00