MIT人工智能实验室研究成果AI系统

2019-08-14 20:41:40 来源: 上饶信息港

MIT人工智能实验室研究成果:AI系统不仅可以识别假,还能辨别个人偏见

互联时代,假铺天盖地,而且极具迷惑性,Facebook一度深陷虚假的泥淖,不但被控影响了美国总统大选结果,甚至引发了德国的巨额罚金。

甚至连以公信力著称的BBC也难以幸免,比如BBC北安普顿分站的推特账号就曾发过这样一条消息:Breaking News: President Trump is injured in arm by gunfire #Inauguration.(劲爆消息:特朗普总统在就职典礼后遭遇枪击,手臂受伤。)

至于国内的假,也是花样百出,甚至对话也能伪造,PS技术出神入化,比如一度引爆互联圈的这个截图:

注:此截图被证实为经过PS伪造

AI系统:建立多维度向量进行数据检测10月4日,麻省理工学院计算机科学与人工智能实验室(CSAIL)在其官发布了一则,宣称该实验室与卡塔尔计算研究所(Qatar Computing Research Institute)的研究人员合作,已经研究出一种可以鉴别信息来源准确性和个人政治偏见的AI系统,该研究成果将于本月底在比利时布鲁塞尔召开的2018自然语言处理经验方法会议(EMNLP)上正式公布。

研究人员用这个AI系统创建了一个包含1000多个源的开源数据集,这些源被标注了“真实性”和“偏见”分数。据称

,这是类似数据集中收录源数量多的数据集。

研究人员写道:“打击‘假’的一种(有希望的)方法是关注消息来源。”“虽然‘假’(帖子)主要在社交媒体上传播,但他们仍然有初来源,即某个站,因此,如果一个站曾经发布过假,很有可能未来还会发布。”

AI系统的新颖之处在于它对所评估的媒介有广泛的语境理解,没有单独从文章中提取特征值(机器学习模型所训练的变量),而是兼顾了、社交媒体,甚至根据url和web流量数据的结构来确定可信度。

该系统支持向量(SVM)训练来评估事实性和偏差,真实性分为:低、中、高;政治倾向分为:极左、左、中偏左、中偏右、右、极右。

根据该团队所述,系统只需检测150篇文章就可以确定一个新的源代码是否可靠。它在检测一个来源是否具有高、低或中等程度的“真实性”方面的准确率为65%,在检测其政治倾向是左倾、右倾还是中立方面的准确率为70%。

注:AI系统分析示例

在上图显示的文章中,AI系统对文章的文案和标题进行了六个维度的测试,不仅分析了文章的结构、情感、参与度(在本例中,分析了股票数量、反应和Facebook上的评论),还分析了主题、复杂性、偏见和道德观念,并计算了每个特征值的得分,然后对一组文章的得分进行平均。

(公众号:)注:“真实性-偏见”预测模型图

和Twitter也被加入了AI系统的预测模型。正如研究者们所言,页面的缺失也许说明了一个站是不可信的,或者页上可能会提到这个问题的政治倾向是讽刺的或者明显是左倾的。此外,他们还指出,没有经过验证的Twitter账户,或者使用新创建的没有明确标注的账户发布的消息,不太可能是真的。

该模型的两个向量是URL结构和web流量,可以检测试图模仿可信来源的url(例如,“”),参考的是一个站的Alexa排名,该排名根据站总浏览量进行计算。

该团队在MBFC(Media Bias/Fact Check )站的1066个源上对此AI系统进行了训练。他们用收集的准确性和偏见数据手工标注站信息,为了生成上述数据库,研究人员在每个站上发布了篇文章(总计94,814篇)。

正如研究人员在他们的报告中煞费苦心的介绍所示,并不是每一个特征值都能有效预测事实准确性或政治偏见。例如,一些没有页面或建立Twitter档案的站有可能发布的信息是公正可信的,在Alexa排名靠前的来源并不总是比流量较少的源更公正或更真实。

研究人员有一个有趣的发现:来自虚假站的文章更有可能使用夸张和情绪化的语言,左倾媒体更有可能提到“公平”和“互惠”。与此同时,拥有较长的页面的出版物通常更可信,那些包含少量特殊字符和复杂子目录的url也是如此。

未来,该团队打算探索该AI系统是否能适应其他语言(它目前只接受过英语训练),以及是否能被训练来检测特定区域的偏见。他们还计划推出一款App,可以通过“跨越政治光谱”的文章自动回复。

该论文的作者、博士后助理拉米?巴利(Ramy Baly)表示:“如果一个站以前发布过假,他们很可能会再次发布。”“通过自动抓取这些站的数据,我们希望我们的系统能够帮助找出哪些站可能首先这么做。”

当然,他们并不是试图通过人工智能打击假传播的机构。

总部位于新德里的初创公司MetaFact利用NLP算法来标记报道和社交媒体帖子中的错误信息和偏见;SAAS平台于去年推出beta版,可以分析错误信息、恶意软件和其他有问题的内容,并可以交叉引用一个定期更新的数据库,其中包含数千条虚假和合法的。

前文中也提到过,Facebook一度深陷假的泥淖,已经开始尝试使用“识别虚假”的人工智能工具,并于近期收购了总部位于伦敦的初创公司Bloomsbury AI,以帮助其鉴别消除假。

假会被消除吗?然而,一些专家并不相信人工智能可以胜任这项任务。卡内基梅隆大学机器人研究所(Carnegie Mellon University Robotics Institute)的科学家迪恩波默(Dean Pomerleau)在接受外媒 the Verge 采访时表示,人工智能缺乏对语言的微妙理解,而这种理解是识别谎言和虚假陈述所必需的。

“我们初的目标是建立一个系统来回答‘这是假,是或不是?’”他说,“但我们很快意识到,机器学习无法胜任这项任务。”

但是,人类事实核查者做的不一定比AI更好。今年,谷歌暂停了“事实核查”(Fact Check)这一标签,该标签曾位于谷歌报道栏,此前保守派媒体也曾指责谷歌对他们表现出了偏见。

不过,无论终鉴别假和个人偏见的解决方案是AI系统还是人工,抑或两者兼而有之,假被彻底消除的那一天都不会立刻到来。

据咨询公司Gartner预测,到2022年,如果目前的趋势不变,大多数发达国家的人看到的虚假信息将会多于真实信息。

via: venturebeat

相关文章:

Facebook:多次分享假 将不准再投广告

BBC 推特被黑发布川普中弹假后,出现了这样搞笑的一幕……

德国推出社交媒体假惩罚机制后,Facebook 上线假过滤器

Google也被假骗了:“奥巴马将第三次竞选总统”

德国出台新政策:Facebook要为每条假支付50万欧元罚款

原创文章,未经授权禁止转载。详情见转载须知。


福州治疗癫痫病权威医院
邵阳癫痫病医院是哪家
连云港好的治癫痫病研究院
白城医院专治癫痫
六盘水癫痫病治疗哪里
本文标签: