你怎么知道随叫随醒的语音助手没有在窃听你?Spotify 之外:瑞典如何走在了欧洲创业前沿 | TechBoard#25

摘要

本文地址:http://www.jtepe.com.cn/news/234019
文章摘要:你怎么知道随叫随醒的语音助手没有在窃听你?Spotify 之外:瑞典如何走在了欧洲创业前沿 ,面试技巧番外篇林肯车,刻画无盐口号小吃。

我们应该相信语音助手不会窃听我们吗?这不是被迫害妄想症,正如同面部识别不只用于解锁,也可以用于监控。或许在未来,语音助手扮演的将不只是倾听者的角色;关于人工智能的种种论断和预言早已不新鲜,甚至人工智能威胁论都成了老生常谈。预言只有在未来能被检验,但它造成的恐慌却发生在当下,这篇文章就是要给诸多不靠谱的预言浇冷水 ……这里是 TechBoard 第二十五期。 TechBoard 是一个全球视野下,甄选每周重要科技评论的栏目。我们将以摘要的形式引入值得阅读的科技评论文章,并鼓励读者去阅读原文。

Hey,Alexa,我们应该相信你吗?

「你怎么知道随叫随醒的语音助手没有在窃听你?」

时下,从手机到智能手表都能够录制声音,家里的智能音箱也是二十四小时连接着网络,这让不少人有了类似上面这种仿佛被迫害妄想症的症状。《大西洋月刊》这个月刊登的这篇文章,就严肃地讨论了这个问题:我们应该相信语音助手吗?

目前,当我们聊到智能语音助手时,亚马逊的 Alexa 无疑是最为「智能」的一家,其中很大原因就是它支持的第三方服务够多,因此显得它「听得懂」很多语音指令。作者开始正视这个问题正是源于一次和 Alexa 的交互,在一个正常的指令交互完成后,Alexa 突然加了一句「好梦」结束了对话。作者并不清楚发生了什么,她只能认为是接入的第三方服务代码出了问题。她不得不开始思考,她的语音指令为什么会「串词」呢?语音助手的制造商们承诺,只有唤醒词之后的语音指令会存在云端,那么,如果用户在谈话中口误说出了近似唤醒词(比如 Alexis)却不知,随后的聊天是否会被识别为指令然后记录到云端呢?

目前,Alexa 已经和超过 20000 个智能家居设备合作,声音来源有耳机、安全系统、汽车等 100 多种产品,尽管亚马逊未公布过销售数字,据分析公司 Canalys 保守估计,今年年底全球智能音箱安装量将达 1 亿。亚马逊和谷歌都在大力推广这些设备,甚至用近乎亏本的折扣销售,这很难不让人联想到亚马逊推广 Kindle 的策略,即硬件不赚钱,靠软件回本盈利的模式。不久的将来,或许 Alexa 不只出现在防盗门上,还有你的空调、咖啡机甚至卫生间都可能融入语音控制系统。这一切看起来都无比自然,因为声音是「看不见」的。


即使是对新技术非常谨慎的人,在面对语音助手时也「软化」了态度。比如许多的父母可能会担心孩子面对屏幕时间过久,但没人会觉得孩子和 Alexa 对话有什么不对。在最近的 NPR/Edison 报告中,近一半购买了智能音箱的父母称,买设备达到了减少屏幕使用时间的目的。这很可能会带来的一个结果是:主要媒介从视觉转变为听觉,交互指令从文字改到口语。作者指出,目前语音设备还在萌芽期,随着销量飙升和数据积累及计算能力的指数级增长,在我们有生之年,很可能这些目前看起来还有点呆傻的语音助手们,会变得非常健谈,同时,基于云记忆,它们也会变得非常个人化,别忘了,到那时,它们可能已经无处不在。

让语音助手能真的算得上「智能」和「健谈」。前提是降低对它能力的期望值,同时要给予它信任。当语音助手一次次「犯蠢」后,用户可能就产生了放弃的想法,但对目前的智能音箱而言,想要理解用户还需要耐心的「训练」,就像训练小孩子听懂成人在说什么一样。口语表达不像文字输入一样精准,它的背景复杂,要想更准确地识别出不那么生硬的语音指令,它需要结合口音、节奏、情绪、背景等等要素,同时,语音助手也只能给予最合适的「一个反馈」,而不是像搜索引擎一样全部呈现出来,任由用户自主选择。

目前计算机已经在学着识别发生者的音调、音量和节奏了,下一步则是学习如何识别到发声时的情绪。只有真正做到这一步,才可以让语音指令开始「无缝」的融入生活,Alexa 可以听出来你的语气和情绪,它对此作出的回应也将变得更具有「亲和感」,长期以往,它甚至会知道每天什么时间段你最开心,可能在你生气时播放舒缓的音乐试图让你平静,在你低沉时给你讲一个笑话……

这是我们想要的智能语音助手吗?如果说当下的青少年称得上是智能手机一代,那么或许未来将产生「智能语音的一代」,就像我们如此沉浸在屏幕里的世界,他们可能会习惯和 Echo 滔滔不绝,正如电影《她》中的情形,手机已经沦为「遥控器」的地步,而日日夜夜伴你左右的是极为了解你的「好友」Samantha。


这篇文章并不是旧调重弹「反乌托邦」,就像我们现在的生活中充斥着各式各样的屏幕,有人觉得是进步,有人觉得是退步。文章只是呈现一个思考的角度,毕竟到目前为止,默认的共识和已成的事实都是我们大多数人的数据和信息在实时被采集着,面部识别技术让威权政府得以监视公民,互联网公司在变卖我们的数据,社交媒体操纵着大众意识,黑客不会溜门撬锁但可以破解家里的安全系统……在未来,双色球专家杀号:语音助手能够了解你的情绪,甚至「左右」你的情绪,至少在目前来看,这很大概率会是一个趋势。

延伸阅读与参考:

我们曾在 TechBoard#10 http://www.jtepe.com.cn/news/229832 中推荐过《我的手机想让我说「谢谢」》其中提到 Google Assistant 的新特性:要求孩子跟语音助手对话时要说「请」和「谢谢」,以及延伸思考情感或行为「智能化」是否合理。

TechBoard#15 http://www.jtepe.com.cn/news/231101《黑镜:屏幕内的反乌托邦如何映照了我们和科技的关系》,在被科技包裹的现代社会,「反乌托邦」的思考永远不会停止,它的必要性就是让它不成真。

TechBoard#19 http://www.jtepe.com.cn/news/232247 《未来在耳:为什么「语音」将是科技的下一件大事》这篇文章讨论了为什么语音将成为下一代交互的「核心行为」。

TechBoard#12 http://www.jtepe.com.cn/news/230482 中推荐过的《苹果的 AirPods 是个预言》作者 Ian Bogost 通过沉浸式使用 AirPods 的体验,感受到了耳机和听觉之于未来生活的可能性。

对于人工智能的错误预言

关于人工智能的种种论断和预言早已不新鲜,甚至人工智能威胁论都成了老生常谈。预言只有在未来能被检验,但它造成的恐慌却发生在当下,这篇文章就是想给诸多不靠谱的预言浇上冷水。

硅谷未来研究所(Insitute for the Future)的联合创始人 Roy Amara 曾提出了著名的阿玛拉定律(Amara』s Law):我们倾向于过高估计技术在短期内的影响,低估它的长期效应。GPS 就是一个典型的例子,它在上世纪 80 年代诞生,本想帮助美国军方准确交付弹药,而后用于飞机导航、车队追踪甚至是监管假释期犯人等等领域,但目前它就在你的智能手表上,从点外卖到户外出行,GPS 早已渗透到我们生活的方方面面。它在 80 年代没有给军方提供多少帮助,但却着实改变了我们的生活。回顾过去三十年,计算能力、基因组测序、太阳能风能、甚至是快递送货,都符合阿玛拉定律。人工智能则是在上世纪 60 年代和 80 年代出现两次「被高估」引发的潮流,作者认为,当下也是人工智能正在被高估的时候,但它这次的「长期效应」或许真正将要到来,问题就是这个长期的时间尺度。

         

我们曾在 TechBoard#23 中推荐过的文章《摩尔定律的终结》,其中就有提到自 2005 年起,微处理器的频率就被限制到了 4GHz 左右,在芯片上安装晶体管数量每两年翻番的摩尔定律已经结束。原本按照摩尔定律,如今的 iPhone 应该有 16000 GB 的存储空间,但实际上最新款的顶配 iPhone XS 也只有 512 GB,这就是因为当存量足以满足一切正常需求后,指数将不再发挥作用。人工智能所基于的深度学习也可能有一个类似芯片更新的指数级增长定律,同样,要么出于经济理由,要么出于物理限制,它也可能会增长到某个点后卡壳,这个点是未知的。

除此之外,还有搭载软件和技术的配套硬件的部署速度。互联网公司可以随时安排一次测试和部署,但硬件则不尽然。我们住的房子、开的汽车,都因为它的固定成本会长期存在,毕竟买一辆车和买一个 app 是无法相提并论的两个概念。因此无论是人工智能威胁论中的「机器人替代人工」还是人工智能相关的硬件产品,它从设计到大规模应用,都需要考虑到寿命,严格规划后再进行部署,在硬件更新换代之前,就只靠软件升级来适配新功能。作者指出,许多人工智能研究人员和专家认为世界已经数字化了,只需引入新的人工智能系统,就会立即渗透到供应链、工厂车间里,这样的想法也是一种没有现实依据的「推演」。

         

想象一下,如果牛顿穿越到今天,给他展示一部 iPhone,天才如他能否能理解这个长方形的发光物体,要知道,电力都是在牛顿去世近百年才被应用的。因此我们很难想象过于远离当下的未来技术,更别提它的局限性了,正如我们看《哈利波特》里的魔法,今天许多技术在百年前的人看来也好似魔法。现在我们基于当下,分析并假设了许多人工智能在未来可能的形态,或许和当下的科幻作品在未来成真的概率差不多。当下对人工智能的预言可能在技术上过于乐观,在社会层面上又过于悲观了。

延伸阅读与参考:

TechBoard#23 《摩尔定律的终结》

我们曾在 TechBoard#16 中推荐过《「科技」是如何发展变化的》,其中就提到了跳出互联网世界外,去思考让我们忘了这一切得以实现的技术基础是什么。

Spotify 和 iZettle 之外:瑞典如何走在了欧洲创业前沿

近十年来,放眼整个欧洲,名声最响也是影响力最大的创业公司是诞生自瑞典的 Spotify,目前 Spotify 的估值约为 296 亿美元,要知道它的邻居、老大哥诺基亚,市值也才不过 305.5 亿美元。前不久,PayPal 22 亿美元收购的移动支付初创公司 iZettle 同样诞生自瑞典,这也是近几年来,欧洲创投圈名声较大的一笔收购案,《经济学人》将瑞典列为「未来五年最佳投资地点」排行榜第一。那么问题来了,瑞典这个国家有怎样的利于科技的生态土壤,能在近十几年来欧洲科技初创企业疲软无力的状态下,诞生出 Spotify 或是 iZettle 这种大型初创团队的呢?

早在这些还称得上是初创公司涌现之前,爱立信、沃尔沃和宜家这种全球知名的大型企业就已深深扎根在瑞典,而 Spotify 作为 IPO 的典范,iZettle 则是被「硅谷」收购的典例,无论是 IPO 还是被收购,这两家初创公司都成功的在瑞典卷起了一股创业热,同时也吸引了国际投资者以及本地那些因 IPO 或被收购后,转行为投资人的注意,二者一结合,就把瑞典推入了天使投资和连续创业者相辅相成的良性循环中。这就让瑞典逐渐形成了创业者的温床。

沃顿商学院 2015 年曾研究瑞典的创业经济,称它为「独角兽工厂」,TechCrunch 也在 2016 年评选瑞典为「北方的科技巨星」。根据 Tech.eu 的数据,2017 年有 120 家瑞典公司上市或被收购,同年,德国有 112 家,英国有 77 家,法国有 44 家。除了德国外,英国和法国的初创公司上市或被收购率分别比 2016 年下降了 26% 会和 31%,而瑞典的 2016 年上市或被收购的初创公司只有 55 家。别忘了德英法三国的人口数量是瑞典的 6 到 10 倍,这么算来,瑞典 990 万人的创业成功率高的惊人。而且瑞典初创公司的涉及领域也非常广,从金融科技到物联网、游戏、B2B,每个热门科技领域都有瑞典公司的身影。

如果说瑞典的高素质的计算机高等教育、培养独立思考和创造力的教育系统、高速网络带宽、优秀的设计传统以及过小的国内市场使得初创团队不得不一开始就放眼全球……这些推力是瑞典创业公司成功的原因,但为什么瑞典偏偏在近十年来才开始井喷式创业?

瑞典的创业热潮正是利用到了网络效应,把并不难得冒出的一枝独秀,开枝散叶做到百花齐放,进而形成了井喷式的创业潮。

譬如 Spotify、King、Minecraft 这样的大型成功案例,吸引到了国际投资者的注意,许多欧洲风险投资公司增加了专注于北欧地区的分部。由于之前投资的回报,瑞典本土的风险投资行业也已经变得更大,资金更充足。同时,无论是市场回报还是创业成就感,都深深吸引着年轻一代,也带动了更多人才的涌入,创业者不仅有可利用的巨大人才库,还有在全球范围内扩大公司规模的经验。正如瑞典著名风投公司 CEO Par Hedberg 所说「这就像雪球效应,越滚越大越滚越快……那些瑞典皇家理工学院的毕业生更想创业而不是进入公司,我们公司都招不到人了。」

然而 Hedberg 提到的大公司招聘难不只是瑞典在近十年创业热潮中,唯一暴露的一个问题。

说是瑞典创业潮,但实际上创业公司还是聚集在首都斯德哥尔摩,正如硅谷所经历的「副作用」,斯德哥尔摩也在走着一条同样的路。自 2012 年起,该城平均房价上涨了 50% 以上,初创公司已经在向周围转移。同时,瑞典还面临着限制性移民政策、高额税收、股票期权等问题,这些都是阻碍创业公司必然走向「到最后不过是被大公司收购」结局的政策原因。

这个雪球已经滚了十年了,从人才储备和培养,到风险投资以及国际声誉,目前瑞典已经形成了一套利于创业的生态系统。这个北欧偏安一隅的国家,是否能再生出一个 Spotify 般具有全球影响力的互联网公司,还是愈发满足于建立能在几轮融资后被硅谷收购的初创公司,生态不是决定原因,反而是要看跳出创业生态外的大环境。至少目前,放眼全欧洲,瑞典是创业环境最好也最有希望的国家。

延伸阅读与参考:

TechBoard#18 中我们推荐过《为什么欧洲出不来大科技公司了》,其中就谈到了全欧洲目前不太理想的创业环境,以及「没什么志气」的创业团队们。

编辑:宋德胜

题图:Roberto Parada

最新文章

双色球专家杀号

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。