莲花门户网
热点专题
当前位置: 首页 >> 热点专题 >> 正文

AI语音助手普遍存在的“窃听”问题,思必驰能解吗?


文章作者:www.ymxsw.cn 发布时间:2019-09-24 点击:614



2019-09-05 15: 07: 59雷锋网络

2011年,Siri成功移植到iPhone 4,然后带有手机声音的新游戏引起了消费者对语音助理的兴趣。 2014年,亚马逊推出了智能扬声器Echo和Alexa语音助手,引领全球智能扬声器热潮。但是,多年以后,语音助手还没有成为消费者无法做到的智能助手,而且由于连续爆发的“窃听”问题也引起了人们的关注。语音助手“窃听”的目的是什么?可以解决语音助手的隐私问题吗?

为什么语音助手会“窃听”?

8月28日,Apple为Siri的隐私道歉,并表示会做出改变。道歉的原因是,7月26日,英国《卫报》报道Siri会在未经用户许可的情况下将用户录音上传到服务器,并将其发送给Apple的外包承包商进行人工分析。这些记录包含敏感信息,如机密性,位置和联系信息。

Siri不是唯一一个窃听隐私的语音助手。同样在7月,比利时新闻网站VRT报道称谷歌涉嫌使用Google智能助理语音助理收听用户的私人谈话,谷歌的一些合作伙伴向他们透露了超过1,000个。录制Google语音助手和客户对话。

4月初,彭博社援引熟悉此事的人士称,亚马逊负责评估Alexa语音助手用户指令的团队,可以获取用户位置信息,甚至是用户的具体家庭住址。

为什么语音助理会被连续暴露于窃听隐私的问题?上海神聪智能的首席技术官朱成玉是一家与中信国际有关联的投资公司中智居源的合资公司,他在接受雷锋采访时表示。 com:“这些公司的目的并非真正侵犯用户的隐私,而是收集一些数据并训练语音助理更加聪明。”

神聪智能CTO朱成玉

这就是语音助理收集录音的地方,Apple在一份声明中表示,Siri会收集并存储用户设备上的特定信息,以便更准确地执行个性化任务。

朱成玉还表示,语音助手技术已经存在,但用户只能使用天气广播,讲故事等功能。一方面,由于语音助理的内容和应用还不够,更多的内容和服务提供商需要打开语音助理的界面;另一方面,为了使语音助理能够完成更复杂的任务,例如预订门票和订购外卖,它需要多轮对话的语音技术,更多的是通过大量的语音技术。数据培训使语音助理能够更好地了解用户。

如何保护隐私?

因此,我们也可以理解语音辅助的困境。 AI语音算法的改进需要大量的数据训练,但数据收集将涉及用户隐私。现在我们需要找到平衡点或解决方案。在这方面,朱成玉提出了他的两个想法。他认为,在这个阶段,我们可以通过使用公认的方法或设定适当的标准,在隐私保护的背景下收集培训数据。此外,随着人工智能技术的发展,成熟后对培训的需求可能会减少,并且“窃听”可能不会发生。

目前,我们还没有看到数据采集的标准,而AI语音算法还没有达到成熟阶段。如何保护用户隐私?朱成玉说:“我们提供的解决方案结合了思博伦的算法和科幻AI芯片的软件和硬件。基于我们强大的AI芯片,我们尝试将云的工作转移到终端,以及语音部分不需要上传到云端。这是对用户隐私的最大保护。“

然而,为了在终端中实现一些云AI功能,终端AI计算能力的提高是至关重要的。朱成玉指出,思博伦的算法可以与Chongcong的芯片深度集成,通用芯片的十分之一甚至百分之一也可以达到同样的效果。对于沉聪来说,目标是提供足够的力量,而不是最强大的力量。

什么样的计算能力适合AI语音芯片?与图像AI芯片相比,由于语音神经网络的大小小于图像的神经网络的大小,因此图像的AI计算能力强于语音。但是,从处理的复杂性来看,两者是等价的。这是因为在将语音转换为单词之后,还涉及语义识别,多轮对话等,这比图像人脸识别稍微复杂一些。

朱成玉表示,沉聪需要估算市场需求,然后将其转化为量化硬件指标。同时,我们必须考虑算法的快速迭代,使用一套方法和过程来应变,而这个应变过程是一个软硬协调的过程。例如,当沉聪定义下一代芯片时,为了实现本地语音识别,将根据当前语音算法所需的计算能力进行评估,然后增加一些冗余。

雷锋网此前报道,沉聪的第一代AI芯片TH1520已经针对硬件和软件进行了深度优化。它基于双DSP架构,集成了编解码器编解码器和大容量内部存储器单元。同时,TH1520使用AI指令集扩展。而算法硬件加速方法,与传统通用芯片相比,效率提高了10倍以上。此外,TH1520还具有计算能力和存储资源的灵活性,可支持未来算法的升级和扩展。

TH1520于2018年8月发布,并于11月亮相。它已经大规模生产。除了支持AI本地语音识别外,沉聪的第二代AI语音芯片还将增加语音识别功能。据朱成玉介绍,支持声纹功能需要更强大的计算能力。沉聪已经开始考虑使用双DSP架构设计芯片架构。

低功耗芯片可实现更好的AI助手

AI语音芯片更强大的计算能力在解决语音助手的隐私问题和实现更复杂的功能方面发挥着重要作用。同时,低功耗对于改善语音助理体验也是至关重要的。目前,配备语音助手的最受欢迎的产品是智能扬声器和智能手机。对于智能扬声器,虽然由电源供电,但低功耗芯片还会影响语音助手是否能够实现高唤醒率,同时减少误唤醒。

朱成玉说,语音助手的唤醒率主要取决于软件的水平。这涉及确认机制。当AI语音芯片不够强时,为了平衡低功耗,一些语音助手可能会把唤醒的阈值。设置非常低,这将带来误唤醒的问题。使用高性能和低功耗芯片,可以在一定程度上解决这个问题。 Congcong TH1520将低功耗和实用性与多级唤醒模式和内置的低功耗IP结合在一起 - On监控阶段的功耗低至毫瓦,典型的运行场景仅消耗数十毫瓦,极端情景的峰值功耗不超过100毫瓦。

手机作为另一种流行的语音助手产品,你可以看到Android手机屏幕可以唤醒语音助手的功能比iOS稍晚,这非常重要,因为手机电池电量,总是执行On需要两者兼顾低功耗和硬件和软件的通用优化。

在未来,AI语音芯片需要实现更低的功耗,以便在更多电池供电的设备中使用语音助理,并最终改变人机交互的方式。那么我们如何才能实现更低的功耗?朱成玉说,一方面,它可以从硬件入手,通过架构提高效率。沉聪定制架构的最大优点是可以根据算法定义合理的芯片参数,以实现更高的能效。另一方面,可以使用较低功率的半导体工艺来降低功耗。

“除了从数字电路开始,还有一些方法可以降低模拟电路的功耗,例如低精度ADC(模数转换器),性能和功耗,而不会影响功能或对功能产生很小的影响。是我们之间的交流。我们有软件和硬件来理解如何交换功率和性能,这对于通用芯片很难。“朱成玉也说。

凭借更高性能和更低功耗的AI芯片,语音助手可以获得更好的体验。例如,家庭中的智能扬声器通常具有多个用户,并且具有更高计算能力和更低功耗的AI芯片可以实现声纹功能,这允许语音助理通过语音的特征来判断对话者,并根据对话人的喜好提供。更个性化,更智能的服务。

此外,更高的能效还可以实现多模式融合,结合AI语音功能和AI图像功能,提供更智能的AI助手。多模态融合可以从算法级别或从硬件模块完成,这是行业正在探索的方向。声纹识别和多模式支持都在Congcong AI芯片产品路线图中。

沉聪智能产品规划路线图

至于AI是需要专用芯片还是通用芯片,朱成玉认为,从芯片开发规律来看,它总是在专用和通用之间流通,但最终还是取决于算法。如果有一种算法可以支配AI,那么AI芯片可能会变得多功能,但目前它更适合AI。

雷锋网摘要

语音助理的智能增强与用户隐私之间存在矛盾。也许是因为Apple考虑了隐私保护。 Siri目前的智力水平比许多其他语音助手弱。但是,公司的软件和硬集成可以在保护隐私方面发挥优势。这是因为硬件和软件的深度集成可以比硬件资源更少的通用芯片实现数十甚至数百倍。提高能源效率。终端AI性能的这种改进具有在终端处理语音部分而无需上传到云的能力,这很好地保护了用户的隐私。

当然,为了更好地推广AI语音助手并实现多模式融合AI助手,在降低功耗的同时提高芯片性能也是非常重要的。对于比算法和软件更强大的思博伦,决定与中芯国际的子公司中芯国际建立合资企业,以确定市场需求并对AI语音市场的前景持乐观态度。从沉聪的路线图来看,我们可以看到它有制定芯片的长期计划。结合Spirit对市场需求的理解优势,未来的软硬件集成方案将显示出更大的优势。

2011年,Siri成功移植到iPhone 4,然后带有手机声音的新游戏引起了消费者对语音助理的兴趣。 2014年,亚马逊推出了智能扬声器Echo和Alexa语音助手,引领全球智能扬声器热潮。但是,多年以后,语音助手还没有成为消费者无法做到的智能助手,而且由于连续爆发的“窃听”问题也引起了人们的关注。语音助手“窃听”的目的是什么?可以解决语音助手的隐私问题吗?

为什么语音助手会“窃听”?

8月28日,Apple为Siri的隐私道歉,并表示会做出改变。道歉的原因是,7月26日,英国《卫报》报道Siri会在未经用户许可的情况下将用户录音上传到服务器,并将其发送给Apple的外包承包商进行人工分析。这些记录包含敏感信息,如机密性,位置和联系信息。

Siri不是唯一一个窃听隐私的语音助手。同样在7月,比利时新闻网站VRT报道称谷歌涉嫌使用Google智能助理语音助理收听用户的私人谈话,谷歌的一些合作伙伴向他们透露了超过1,000个。录制Google语音助手和客户对话。

4月初,彭博社援引熟悉此事的人士称,亚马逊负责评估Alexa语音助手用户指令的团队,可以获取用户位置信息,甚至是用户的具体家庭住址。

为什么语音助理会连续窃听隐私问题?上海崇聪智能(精神与中芯国际的子公司中芯国际的合资公司)首席技术官朱成玉在接受雷锋独家专访时表示。 “这些公司的目的不是为了侵犯用户隐私,而是为了收集一些数据经过培训,使语音助手变得更聪明。”

沉聪智能CTO朱成玉

这确实是语音助手收集录音的目的,Apple在声明中表示,为了更准确地完成个性化任务,Siri将收集并存储用户设备上的特定信息。

朱成玉还表示,语音助手的技术已经存在,但用户更有可能使用天气广播和讲故事的功能。一方面,由于语音助手后面连接的内容和应用程序不够,更多的内容和服务提供商需要打开语音助手的界面;另一方面,语音助手需要完成更复杂的任务,如预订门票和呼叫外卖,需要多轮对话的语音技术,还需要大量的数据培训才能让语音助手理解用户。

如何保护隐私?

由此,我们也可以了解语音协助所面临的困难。 AI语音算法的推广需要大量的数据用于培训,但数据的收集涉及用户隐私,现在我们需要找到平衡或解决方案。在这方面,朱成玉提出了他的两个想法。他认为,在这个阶段,培训数据可以通过完善的方法或标准以受保护的方式收集。此外,随着人工智能技术的发展,在成熟期后对培训的需求可能不会那么强烈,并且“窃听”可能不会发生。

目前,我们还没有看到数据采集的标准,而AI语音算法还没有达到成熟阶段。如何保护用户隐私?朱成玉说:“我们提供的解决方案结合了思博伦的算法和科幻AI芯片的软件和硬件。基于我们强大的AI芯片,我们尝试将云的工作转移到终端,以及语音部分不需要上传到云端。这是对用户隐私的最大保护。“

然而,为了在终端中实现一些云AI功能,终端AI计算能力的提高是至关重要的。朱成玉指出,思博伦的算法可以与Chongcong的芯片深度集成,通用芯片的十分之一甚至百分之一也可以达到同样的效果。对于沉聪来说,目标是提供足够的力量,而不是最强大的力量。

什么样的计算能力适合AI语音芯片?与图像AI芯片相比,由于语音神经网络的大小小于图像的神经网络的大小,因此图像的AI计算能力强于语音。但是,从处理的复杂性来看,两者是等价的。这是因为在将语音转换为单词之后,还涉及语义识别,多轮对话等,这比图像人脸识别稍微复杂一些。

朱成玉表示,沉聪需要估算市场需求,然后将其转化为量化硬件指标。同时,我们必须考虑算法的快速迭代,使用一套方法和过程来应变,而这个应变过程是一个软硬协调的过程。例如,当沉聪定义下一代芯片时,为了实现本地语音识别,将根据当前语音算法所需的计算能力进行评估,然后增加一些冗余。

雷锋网此前报道,沉聪的第一代AI芯片TH1520已经针对硬件和软件进行了深度优化。它基于双DSP架构,集成了编解码器编解码器和大容量内部存储器单元。同时,TH1520使用AI指令集扩展。而算法硬件加速方法,与传统通用芯片相比,效率提高了10倍以上。此外,TH1520还具有计算能力和存储资源的灵活性,可支持未来算法的升级和扩展。

TH1520于2018年8月发布,并于11月亮相。它已经大规模生产。除了支持AI本地语音识别外,沉聪的第二代AI语音芯片还将增加语音识别功能。据朱成玉介绍,支持声纹功能需要更强大的计算能力。沉聪已经开始考虑使用双DSP架构设计芯片架构。

低功耗芯片可实现更好的AI助手

AI语音芯片更强大的计算能力在解决语音助手的隐私问题和实现更复杂的功能方面发挥着重要作用。同时,低功耗对于改善语音助理体验也是至关重要的。目前,配备语音助手的最受欢迎的产品是智能扬声器和智能手机。对于智能扬声器,虽然由电源供电,但低功耗芯片还会影响语音助手是否能够实现高唤醒率,同时减少误唤醒。

朱成玉说,语音助手的唤醒率主要取决于软件的水平。这涉及确认机制。当AI语音芯片不够强时,为了平衡低功耗,一些语音助手可能会把唤醒的阈值。设置非常低,这将带来误唤醒的问题。使用高性能和低功耗芯片,可以在一定程度上解决这个问题。 Congcong TH1520将低功耗和实用性与多级唤醒模式和内置的低功耗IP结合在一起 - On监控阶段的功耗低至毫瓦,典型的运行场景仅消耗数十毫瓦,极端情景的峰值功耗不超过100毫瓦。

手机作为另一种流行的语音助手产品,你可以看到Android手机屏幕可以唤醒语音助手的功能比iOS稍晚,这非常重要,因为手机电池电量,总是执行On需要两者兼顾低功耗和硬件和软件的通用优化。

在未来,AI语音芯片需要实现更低的功耗,以便在更多电池供电的设备中使用语音助理,并最终改变人机交互的方式。那么我们如何才能实现更低的功耗?朱成玉说,一方面,它可以从硬件入手,通过架构提高效率。沉聪定制架构的最大优点是可以根据算法定义合理的芯片参数,以实现更高的能效。另一方面,可以使用较低功率的半导体工艺来降低功耗。

“除了从数字电路开始,还有一些方法可以降低模拟电路的功耗,例如低精度ADC(模数转换器),性能和功耗,而不会影响功能或对功能产生很小的影响。是我们之间的交流。我们有软件和硬件来理解如何交换功率和性能,这对于通用芯片很难。“朱成玉也说。

使用性能更高、功耗更低的人工智能芯片,语音助手可以获得更好的体验。例如,家中的智能音箱往往有多个用户,计算能力更高、功耗更低的人工智能芯片可以实现声纹功能,语音助手可以通过语音的特征来判断对话人,并根据对话者的喜好提供。更加个性化、智能化的服务。

此外,更高的能效还可以实现多模态融合,结合人工智能语音功能和人工智能图像功能,提供更智能的人工智能辅助。多模态融合可以从算法层面进行,也可以从硬件模块进行,这是业界正在探索的方向。声纹识别和多模式支持都在聪聪爱芯片产品路线图中。

沈聪智能产品规划路线图

至于人工智能是需要专用芯片还是通用芯片,朱成玉认为,从芯片发展的规律来看,它总是在专用和通用之间循环,但最终取决于算法。如果有一种算法可以主宰人工智能,那么人工智能芯片可能已经变得通用,但目前它更适合人工智能。

雷锋网摘要

语音助理的智能增强与用户隐私之间存在矛盾。或许是因为苹果考虑了隐私保护。Siri目前的智力水平比其他许多语音助手都要弱。然而,公司的软件和硬集成可以在保护隐私方面发挥优势。这是因为软硬件的深度集成可以在硬件资源较少的情况下,实现比通用芯片多几十倍甚至几百倍的性能。提高能源效率。这种对终端人工智能性能的提高,能够在不上传到云端的情况下对终端的语音部分进行处理,很好地保护了用户的隐私。

当然,为了更好地推广AI语音助手并实现多模式融合AI助手,在降低功耗的同时提高芯片性能也是非常重要的。对于比算法和软件更强大的思博伦,决定与中芯国际的子公司中芯国际建立合资企业,以确定市场需求并对AI语音市场的前景持乐观态度。从沉聪的路线图来看,我们可以看到它有制定芯片的长期计划。结合Spirit对市场需求的理解优势,未来的软硬件集成方案将显示出更大的优势。

下一条: 博物馆里过“六一” 陌陌直播公益课带乡村孩子领略两汉风韵