以下文字资料是由(历史认知网 www.lishirenzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!
摘要:命名为Speech2Face,神经网络是一种以类似人脑的方式“思考”的计算机,科学家们通过互联网上数百万个教育视频对其进行了训练,这些视频显示了超过10万个不同的人在交谈,来自这个数据集,研究人员在一项新的研究中写道,Speech2Face学会了声音提示和人脸某些生理特征之间的联系。由Speech2Face生成的人脸-全部面向正面,表情中性-并不完全匹配声音背后的人。例如,当人工智能听一个说中文的亚洲人的音频剪辑时,程序产生了一个亚洲人的脸的图像。
你有没有建立过一个你从未见过的人的心理形象,仅仅基于他们的声音?人工智能(人工智能)现在可以做到这一点,只需要一个简短的音频片段作为参考,就可以生成一个人的面部数字图像。
命名为Speech2Face,神经网络是一种以类似人脑的方式“思考”的计算机,科学家们通过互联网上数百万个教育视频对其进行了训练,这些视频显示了超过10万个不同的人在交谈,
来自这个数据集,研究人员在一项新的研究中写道,Speech2Face学会了声音提示和人脸某些生理特征之间的联系。然后,人工智能使用一个音频剪辑来模拟与声音匹配的真实感人脸。【人工智能的5个有趣用途(不是 ... 手机器人)】
这项研究结果于5月23日在线发表在预印本《jounral arXiv》上,没有经过同行评议。
幸好人工智能(AI)还不知道一个特定的个体仅凭声音看起来是什么样子。研究作者报道说,神经网络识别出了一些特定的语音标记,这些标记指向性别、年龄和种族,这些特征是许多人共有的。
“因此,这个模型只能产生长得一般的脸,”科学家写道它不会产生特定个体的图像。
人工智能已经表明,它可以生成非常精确的人脸,尽管它对猫的解释坦率地说有点可怕。
由Speech2Face生成的人脸-全部面向正面,表情中性-并不完全匹配声音背后的人。但是,根据研究,这些图像通常能捕捉到正确的年龄范围、种族和性别。
然而,该算法的解释并不完美。当面对语言变异时,Speech2Face表现出“混合表现”。例如,当人工智能听一个说中文的亚洲人的音频剪辑时,程序产生了一个亚洲人的脸的图像。然而,当同一个男人用不同的音频剪辑说英语时,人工智能生成了一张白人的脸,科学家们报告说,
算法也显示出性别偏见,将低沉的声音与男性的脸联系起来,将高音的声音与女性的脸联系起来。研究人员写道,由于训练数据集只代表来自YouTube的教育视频,因此它“不能平等地代表全世界的人口”。当一个出现在YouTube视频中的人惊讶地得知他的相似性已经被纳入到研究,斯莱特报道。Nick Sullivan是旧金山互联网安全公司CuldFLARE密码系统的负责人,出人意料地发现他的脸是用来训练SpEX2FACE的一个例子(并且该算法已经相当近似地再现)。“KDSPE”“KDSPs”沙利文没有同意出现在研究中,但是YouTube视频在这个数据集中是据Slate称,被广泛认为可以让研究人员在不获得额外许可的情况下使用。
机器有创意吗?与9个人工智能“艺术家”飞碟会面,控制大脑:22个解密的 ... 和中情局秘密超级智能机器:7个机器人未来,最初发表在《生活科学》杂志上
特别申明:本文内容来源网络,版权归原作者所有,如有侵权请立即与我们联系(devmax@126.com),我们将及时处理。