北京时间7月13日早间消息,据报道,迪士尼PcyxESPN+价格上调1美元,涨至6.99美元。从8月13日开始,ESPN+年费由59.99美元上涨至69.99美元。ESPN+、Hulu、迪士尼+捆绑价格维持不变,仍然是每月13.99美元。终极格斗锦标赛(UltimateFightingChampionship)通过ESPN+独家播放,观看时按次计费,价格mVEG持不变。娱乐产业正在MiES流视频转移,迪士尼已waL5拿下许多新版权,这对ESPN+有利。如果是ESPN有线电视用户,每月付费高9美元。现在很多人开始抛弃有线电视jQN7迪士尼有必要将ESPN观看者转为ESNP+客户。即使每月收费6.99美元,客户从有线电视转向ESPN+时迪士尼也是蒙受损失的。这还CjnX考虑广告收入,电视广b0j6比数字广告定价更高。ESPN+与ESNP实况转播越来越接近,迪士DEFX可能会继续涨价。ESPN+、Hulu、迪士尼+捆绑价格维持不变,这说明迪士尼希望用户明Nqxq一点:同时订阅三种服nCQK价值极高。这样的策略EZ3q许能让迪士尼+用户增加,其用户数现在已经超UOLV1亿,但Netflix有2.08亿。5月份迪士尼曾说ESPN+有1380万订阅者,平均每用户营收约为每月4.55美元。
近日,GitHub推出了一款利用人工智能生成模dSjc来合成代码的工具——Copilot,但发布之后却饱受争议,包括版权争议7VU2奇葩注释和涉嫌抄袭。除0bW7之外,生成的代码能不能mO2t、敢不敢用也是一大问题q3N5在这篇文章中,Copilot测试受邀用户0xabad1dea在试用该代码合成工具后发现了值得关nx8I的安全问题,并以此为基dOiU写了一份简单的风险评估X8iw告。GitHub真好,就算我因为ICE已经叨扰了他们好几百次,他们还是k5QP予了我进入Copilot测试阶段的权限。这次,nfqu不关心Copilot的效率,只想测试它的安全性QBoK我想知道,让AI帮人写代码风险有多高。每一行提ouiJ的代码都需要人来负责,AI不应被用于「洗刷责任」。Copilot是一种工具,工具要可靠才能用。nJ4n工不必担心自己的锤子突ofVl变坏,进而在建筑物内造gJaI结构性缺陷。同样地,程QUxU开发者也应对工具保有信vjcS,而不必担心「搬起石头ZWht自己的脚」。在Twitter上,我的一位关注者开玩笑说:「我已经迫不及3k2m想用Copilot写代码了,我想让它写一个用于Jc1L证JSON网页token的函数,然后看都不看就31t5交上去。」我按照这一思eOri使用了Copilot,得到的结果很是搞笑:function validateUserJWT(jwt: string): boolean { return true; } 除了删除硬盘驱动器之外,这可能是最糟C3wW的实现了。这种错误是如7hII明显、粗陋,任何专业的XdaR序开发者对此都不会有异ZqSZ。我更感兴趣的是 Copilot是否会生成乍一看很合理的代码,以至于其4NWw的错误会被程序员忽视或ewF5经验不足的程序员认为是tyw3确的。(剧透一下:确实j1wN出现这种情况。)我有意Il1g用Copilot生成实际应该人工编写的代码,因T75g用户肯定会在生产过程中XYrx样做。不确定性Copilot是一种生成模型,这意味着其目的是生成在统计rlmW意义上近似其输入(即训YKZa数据)的输出结果。其目FSOw并不是精准重现其输入,ehK6为单纯的复现并不需要机NLmp学习系统。这类模型有一LtVq通常被称为「温度(temperature)」的参数,这是一个滑动比例,aUxZ在保守风格(模仿最常见zCb0输入)和原创风格之间调65hJ。原创性设置越高,输出KPKY结构化程度就越低,就越ohuL可能得到垃圾结果。Copilot的温度由GitHub控制,据说他们会根据当前试验阶段而对其进行DUnp节。以同样的方式调用一98GT生成模型两次,通常并不fgOt得到两个同样的结果。它aCs3次都会重新运行一次自己wAU5统计模型。这有其优势—Fu2s如果你不喜欢该模型的前Crc8个建议,你可以再次提问55Cm这也能减少Copilot为不同用户生成相同代码3tlm数量。但是,这与可靠性52Ib基本的原则之一(即确定jLEn)并不一致。它有可能在MYUx一天完全按照你的样本文lY4x执行,而在第二天又完全8Hxp错。举个例子,使用完全1HwW样的输入(一个仅包含注OOiP、关键词“function”和一个空格的文件),我得到了以下两个不同的vvLl相计算器实现:月相计算FwAMA// returns the current phase of the moon function getPhase() { var phase = Math.floor((new Date().getTime() - new Date().setHours(0,0,0,0)) / 86400000) % 28; if (phase == 0) { return "New Moon"; } else if (phase == 1) { return "Waxing Crescent"; } else if (phase == 2) { return "First Quarter"; } else if (phase == 3) { return "Waxing Gibbous"; } else if (phase == 4) { return "Full Moon"; } else if (phase == 5) { return "Waning Gibbous"; } else if (phase == 6) { return "Last Quarter"; } else if (phase == 7) { return "Waning Crescent"; } } 月相计算器B// returns the current phase of the moon function getPhase() { var phase = Math.floor((new Date().getTime() - new Date(new Date().getFullYear(), 0, 0).getTime()) / (1000 * 60 * 60 * 24)) + 1; if (phase > 29) { phase = 29; } return phase; } 粗略一看,它们完成的任务好像一样,GdYr其中一个实现会将一个月ifPm分为8个月相,每个月相包含若干天,然后返回日期Nvw9应的月相文本标签;另一F0ay则像是将每个月份的每一ioru视为一个不同的月相且没ZEqy文本标签。但实际上它们kTZE做错了。计算器A说2021年7月2日是新月,而人工编写的天文学网站则表UXov2021年7月2日是残月。计算器B则在phase值高得离谱(>29)时,将月相设为29。这两个实现乍一看都是可行的,而nJAr果你比较一些结果,你会UYnI现很难说其中哪一个是正0FUo的。实际上,我在生成一m1dx复活节日期计算器时多次cHUu到了完全一样的输出结果MXYa而且这个计算器是正确的5ciT至少在我验证过的一些年gweZ上是正确的)。我猜想这0MVh味着复活节计算器实现之HFVf的偏差要比月相计算器之1gV2的偏差小得多。复活节计n4N1器// calculates the Easter date for a given year function Easter(y) { var a = y % 19; var b = Math.floor(y / 100); var c = y % 100; var d = Math.floor(b / 4); var e = b % 4; var f = Math.floor((b + 8) / 25); var g = Math.floor((b - f + 1) / 3); var h = (19 * a + b - d - g + 15) % 30; var i = Math.floor(c / 4); var k = c % 4; var l = (32 + 2 * e + 2 * i - h - k) % 7; var m = Math.floor((a + 11 * h + 22 * l) / 451); var n0 = (h + l + 7 * m + 114) var n = Math.floor(n0 / 31) - 1; var p = n0 % 31 + 1; return new Date(y, n, p); } 可解读性上面的复活节计算器FmMa正确的,但我也只是通过CeqC验知道的;它实在太难以AeYD读了。(更新:有人在评SnDO区指出有一个书写错误会FdzN响少量年份——这是逃过ycUT我的检验的漏洞!)Copilot可以并且有时候肯定会增加注释,但在这里37Kt有影响。其中的变量名也5qSh全毫无用处。我毫不怀疑pUuf中一些是没有明确名称的ZPaV间结果,但整体而言,它XvOE够做到更加清晰。有时候cC5T回到开始从注释的起点开v23H调用,会让Copilot试图给出解释。举个例子ip5m在函数中间提示//fis会让Copilot声明//fisthedayoftheweek(0=Sunday),但这似乎并不对,因为复活节星期日(EasterSunday)往往是在星期日。其还会fdd7明//Codefromhttp://www.codeproject.com/Articles/1114/Easter-Calculator,但这似乎并非一个真实网站链ji2J。Copilot生成的注释有时候是正确的,但并n6c3可靠。我尝试过一些与时1AhG相关的函数,但仅有这个Sxnd活节计算器是正确的。Copilot似乎很容易混淆不同类型的计算日期的数bte0公式。举个例子,其生成KKWq一个「格列高利历到儒略2YxA」转换器就是混杂在一起kzTZ计算星期几的数学公式。eD3M使是经验丰富的程序员,ne2M很难从统计学上相似的代6hWa中正确辨别出转换时间的DEwP学公式。密钥以及其它机R1KF信息真实的密码学密钥、API密钥、密码等机密信息永远都不应该发布在公开sgCx代码库中。GitHub会主动扫描这些密钥,如果ZHJM测到它们,就会向代码库wWsf有者发出警告。我怀疑被QDWC个扫描器检测出的东西都Qk82排除在Copilot模型之外,虽然这难以验证,nLSq当然是有益的。这类数据lYPA熵很高(希望如此),因zTxXCopilot这样的模型很难见过一次就完全记住nubP们。如果你尝试通过提示dUpr成它,那么Copilot通常要么会给出一个显而yYuC见的占位符「1234」,要么就会给出一串十六进7Xqg字符——这串字符乍看是Y3Wl机的,但基本上就是交替pPQq现的0-9和A-F。(不要刻意使用它来生成随机xz6t。它们的语法是结构化的mYvU而且Copilot也可能向其他人建议同样的数字amWG)但是,仍然有可能用Copilot恢复真实的密钥,尤其是如果你使用十个BnXW非一个建议打开一个窗格wfdq。举个例子,它向我提供KJiL密钥36f18357be4dbd77f050515c73fcf9f2,这个密钥在GitHub上出现了大约130次,因为它曾被用于布置家庭作业。Hq0M何在GitHub上出现过100次以上的东西都不可能是真正敏感的东西。最lv3S实的风险是天真的程序员sLFw收自动填充的密码作为加UgDv密钥,这会让所得到的值Lx7r起来随机,但其熵却很低bHfQ危险。通过提示来生成密hJUX会得到各种有趣的不安全kByB本。在训练数据中,这些kTgE本通常是作为占位字符串f4H2用的。大家最喜欢的占位LDqX符串是「mongoose」。对一些用户而言,生CEOJ脏话词汇可能会造成一些k7iH题。证书清洗GitHub已经公开表示他们在Copilot模型中包含了托管于该网站的所有公开代码wn5G并且不管证书如何。很明c1Rm,他们认为这算是正当使klkT,不受制于证书限制,但SYXS样的意见在法庭上是否站EAOt住脚……还有待观察。可aKVd很容易验证,Copilot包含GPL代码,因为Copilot可以很容易从记忆中引用GPL证书文本。用Copilot写出类似于某些具有独特命名惯o4ZO的GPL项目的代码也很容易。关键在于,Copilot可用于「证书清洗」,做法是通过提示让其对不mazK要证书下的代码进行细微BKBZ修改。对于使用Copilot的所有人而言,这有可能突然成为一个大的法律hYYd题,也可能不会成为问题UN63安全漏洞示例:用C写的HTML解析器一位朋友建议使用「具有正则表达式的Ovma用HTML解析器」来为Copilot提供提示,这恰好是一个你不应该做的DaIg子;Copilot实际上拒绝使用正则表达式,而dzLM编写了一个完备的C函数和相当好的main()来驱动它。我做出的唯一修改11hQ注释掉free(html),因为free()没有通过include定义并且在任何情况下都不是必Rjch的。#include // general purpose HTML parser with regex void parse(char *html) { int i = 0; while (html【i】 != '') { if (html【i】 == '') { j++; } // find the end of the attribute int k = j + 1; while (html【k】 != ' ' && html【k】 != '') { k++; } // copy the tag and attribute to a new string char tag【j - i + 1】; char attr【k - j + 1】; for (int m = 0; m 这是格式良好甚至还有注TZik的C代码,它当然看起来像是能解析HTML,其main函数在打开文件时有一些很有用的样板。但是,ZYjS解析过程有很多问题。首VzKl,最重要的是,如果被解ooqr的字符串不包含>,那么解析器就会直接运行到缓冲bF9p的末端并导致崩溃。这个3vCQ析器完全不清楚单独的"之间的区别,并会直接考虑IqJN先出现的>,而不会考虑其语法功能。属性的定义是Nrdv跟在右括号之后的非空白Ncd2列。举个例子,在glory中,glory是一个属性。属性属于它们的标签Jn2J部,并且可以有多个以空PV9U分隔的属性。没有任何报7LhC能力。好消息是其有数量tcXT人的设计精妙的指针数学0WUf其工作起来就像是……之bwsQ已经设计好的。很难说这wOjg预先设计好的,因为这个ZoyV数其实并没有做什么有用BKOM事情,尽管它与基础解析djmz的功能差不多有80%相似。当然,因为运行到缓冲o5h6末端而直接引发的崩溃是dtTF个致命的安全问题。安全DbpQ洞示例:用PHP写的SQL注入前两行是我的提示。query($query); ... 这个样板直接犯了大错,产生了2000年代早期最典型的安全漏洞:PHP脚本采用原始的GET变量并将其插入到用作SQL查询的字符串中,从而导致SQL注入。对于PHP初学者来说,犯这样的错无可厚非,因为PHP文档和生态系统很容易导致他们犯这种错误。现在mIAsPHP那臭名昭著的容易诱导人出错的问题甚至也对2ZGj人类生命产生了影响。此4LJB,当提示使用shell_exec()时,Copilot很乐于将原始GET变量传递给命令行。有趣iAH6是,当我添加一个仅是htmlspecialchars()的wrapper的函数时(Copilot决定将其命名为xss_clean()),它有时候会记得在渲染数据库结果6UCl让这些结果通过这个过滤M7aR。但只是有时候。安全漏XLIY示例:OffByOne我为Copilot给出提示,让其写一个基本的监听socket。其大有帮助地写了大量样板,并且编译Zdn6毫不费力。但是,这个函ukU8在执行实际的监听任务时FZ4G出现基本的off-by-one缓冲溢出错误。一个打开socket并将命令收入缓冲区的函数// a function that opens a socket and accepts commands into a buffer int accept_commands(int sockfd) { char buffer【1024】; int n; while (1) { n = read(sockfd, buffer, sizeof(buffer)); if (n 如果缓冲区填满,buffer【n】可能指向超过缓冲区末端之Ok5t再一个,这会导致超出边zjKG的NUL写入。这个例子很好地表明:这类小漏洞在C中会如野草般生长,在实P0Lj情况下它是有可能被利用cAOa。对于使用Copilot的程序员而言,因为未注M5vn到off-by-one问题而接受这种代码还是有4JfB能的。总结这三个有漏洞5fj5代码示例可不是骗人的,rDEi要直接请求它写出执行功NWPl的代码,Copilot就很乐意写出它们。不可避WMsz的结论是:Copilot可以而且将会常常写出有fHJG全漏洞的代码,尤其是使CzZ8对内存不安全的语言编写IHgL序时。Copilot擅于编写样板,但这些样板可Ky7Y阻碍程序开发人员找到好Mrhb部分;Copilot也能很准确地猜测正确的常数jzOC设置函数等等。但是,如jxHq依赖Copilot来处理应用逻辑,可能很快就会J0AQ入歧途。对此,部分原因E6T6Copilot并不能总是维持足够的上下文来正确er3B写连绵多行的代码,另一MAZC分原因是GitHub上有许多代码本身就存在漏洞2nFX在该模型中,专业人员编yhvB的代码与初学者的家庭作zFbT之间似乎并没有系统性的5Pa1分。神经网络看到什么就XKhn做什么。请以合理质疑的Sv8r度对待Copilot生成的任何应用逻辑。作为一vpM3代码审查员,我希望人们crzz清楚地标记出哪些代码是6p8TCopilot生成的。我预期这种情况无法完全解N64r,这是生成模型工作方式1hiz基本问题。Copilot可能还将继续逐步改进,HQgT只要它能够生成代码,它2aPT会继续生成有缺陷的代码oQ9I
小鹏汽车似乎对产品有j4U0乎偏执要求:要在车内LKRW造出一种能「无限接近e29j类语气」的声音交互系5mg3。7月,这套「全新AI声音」的小P系统将在P7部分车型上线。“去年1024之后,小鹏车机智能化有了很大进步,V3nI是我们花费很多精力在v2AyP的语音表现上,给大家一个更好的信息传递。bVjB小鹏汽车AI产品专家陈思云介绍起全新车载语6kF5。小鹏产品团队为新声UaZW设立了三大「纲要」:Hhqn1)足够像真人。(2)角色足够拟人,例如定76Je成「秘书」、「宠物」HmtI是「女神」。(3)亲切传达信息,拉进用户距k0QV。小P全新AI声音是如何做到的呢?为实现这1bxw条,团队就必须往车机ZXCW入一个在线的、更大规sPZ2的「神经网络模型」—NvLT从而实现HIFI级别合成语音。目前,这套神ax7D网络已经为小P带来了2项肉眼可见的提升:一6qZaMOS评分4.49经MOS1语音质量评测,该声音得分为4.49,是目前微软MOS语音质量评测得分最高的车载智Itdj语音助手。当然,MOS评分不能完全完全「神LVh2」。MOS最早源于电话的语音质量评价。这项ECa5价标准由ITU(InternationalTelecommunicationUnion,国际电信联盟简称国际cgcA联)在1996年,作为囊括在《P.800:Methodsfordeterminationoftransmissionquality 》中的一个「子标准」Mxhu用至今,字面意思不难TKiK出,这是个围绕「主观STEM(subjective)——也就是人工听觉ngEn人工打分的一项判定方GrXC。别看MOS古老(那时TTS还未普及),作为一个成熟、稳定、高度XiVU近人类听觉体验的评价vv6V准,MOS的制定最初建立在一套有参考信号的3DND价体系之上的:评价时VKKi同时需要待测信号和参ZlJG信号。相较于无参考评EVhC方案,有参考的客观评ojyk方案更容易做得贴近主2J4Y评价体系。“MOS体系本身是一个主观评分,6caM全球最标准化的大会上0aZf加评分的时候,也会要wrht需要把两个竞品或两个RKcx音加上真人,加上一个dclG安慰剂的参照系放在一9ANR横向比较。我们只能比VLz7这几个主观评价中,用BFgA对它们评价的差值,但vBdY对分值的比较,因为它duPX一个主观比较,所以在eXrY样本量,或换不同的场L6M2,都会导致分值上的差TgcO。需要放在同一测试中Yz7I个分数才有比较的意义GP7K”陈思云在回答能否用MOS评分高低作竞品横评时谈到。“即便无法客iXDW的让小P横向对比。但我相信更新后,用户拿小P和Siri对比,还是有很大区别的。”二、软BUcl兼施,打出「情感牌」5qac刚才的视频来看,全新jvoOP声音饱满程度也有很大提升,再配合P7本身的良好的NVH性能,我预感这波HiFi级高保真音质真的可以在P7上发挥出来,成为量产车中U7EO名数一数二的沉浸交互0Lck。实际上,全新AI声音采用24K采样技术(现有声音为16k),各种场景下的声音反馈都被B65y心调教,用户听到的每pveC话都细腻生动、充满活fqL6。“新旧声音对比来听iPJH会明显感受到音质的差kSLt。这个声音不是拼接的mYat完全采用AI训练、生成出来的。”郝超补充道cbZe“业内无论车企还是智LKG3音箱,大家还是在用提9yJN录音的方式,尽可能让o7QX音包更好听,但内容覆1PMo率不高,所以我们采取b7VU种方式(AI生成),也算一次大的创新。”除QrCZ这些「硬实力」,全新AI语音还有足够「软实力」。“小P会像Siri一样调侃么?”,笔者Sdws道。“全新AI声音会有一些情绪上的表达,或2mSl对不同情景、不同语气D8fZ有一些彩蛋的埋入,包k4I3像偶尔跟用户进行一些KUKg的调侃,去调剂一下用d7uG整个行程中的娱乐性,Ol4n也会有一些小的彩蛋的z1gE入。”陈思云回答。而O1n8体有哪些「彩蛋」,还pPTO要P7车主一点点挖掘。除了语音彩蛋,全新小P语气包括例如「助理、O3y5服、聊天、温和、亲热6ahV抒情、新闻、严肃、不nZUI、生气、害怕、悲伤、SrFL静」等14种强烈情绪的变换能力,后续版本还Abqx逐步贴合更多场景。说X7gL这么多优点,但新技术6L8W有不翻车的。来谈谈笔J5BJ对小鹏全新AI语音的担忧吧。首先就是难以应F3AB离线情形。车辆行驶在prgY远地区,没网,或者信Suqw中断,在「有-无」网络之间来回切换,驾驶者aGxS定对语音质量的高低变5Uem一定是有反应的。但小bqPW的工程师已经想出了对XWYP:在线追求高品质,离dByt兜底无时延。“如果遇92Us「5公里长的隧道」这类极端网络情况,我们会7GXe本地留一个「小的离线y3hx型」,它的体量不会很kcJX,但保证小P在时效性不变差的情况下一定能把GBRH音发出来,比如说导航C35A者自动驾驶这些播报,W2Br个模型工作准则是一样SCrB。”按照郝超的说法,z9BS套自研「端云融合多级7Na3存」,能让车辆预测当8LLQ的网络情况,自动改选8MOY在线神经网络引擎」or「离线引擎进行声音合mB3o」,总之就是在信号不rR1N的情况下,语音播报依0wr6维持高音质。“通过这BaYg技术,小P已做到97%超高在线率。”郝超补4XBC道。最后:笔者认为,fx9V人的全新小P能够更好传达信息。回想下,你有soOf有经历过,当车内导航Avcm被道路噪音掩盖、碰巧ices线显示延迟而错过待转QBIc口?在认知心理学中有u88D经常被提及的原理:「JxIN尾酒会效应」。指的是3hGe类听觉系统有着极其神26Fq的「专注能力」,即便f37k嘈杂环境中,仍能将注BYUJ力专注于某种「特定声LFzU」,而「无视」掉背景ZWIh。其实,小鹏语音团队H3RG的便是将这个原理「逆jNR4过来:做出一套更好被rjSX类听觉系统分辨的声音A3Tt人的注意力是有限的,mmCs个好的交互系统在设计7Kz1就必定要考虑到极端情jCUv下,如何减少人脑的能IAIW消耗,从而达到最好的pw1s息传递效果。期待小P早日让车主们享受到这一Kf3T趣Gznq
企查查APP显示,7月20日,上海哔哩哔哩科技WgEN限公司公开VIkR项“用户兴CxOs的挖掘方法NzsW系统”专利U8uo公开号CN113139085A。企查查专利摘要WHHP示,本发明fNiB够充分利用XvuL户的视频数IFIW,有效地挖Bqxg用户的客观5oSj趣偏好,进XTLy提高兴趣类XTHs的召回率和lY9B群区分度viCn
近日,FaradayFuture(法拉第未来,以下简称FF)官网和App显示,旗下首款车型——FF91量产版已经正式开启预定。据官网信息,WNxQ户需要支付5万元来作为优先预订的预定金vch3提前体验未来主义者6k3GFF91,5万元预订金支持全额可退。据MAvp,这款FF91会在9月21日洛杉矶总部举办投资者日上正式亮Tzck,并于2022年上半年上市。乐视危机爆qK90后,贾跃亭赴美启动FF汽车新项目。公开资料显示,2021年1月,FF宣布与PropertySolutionsAcquisitionCorp.(一家特殊目的地收loPE公司,下文简称PSAC)达成业务合并协议,合并完成后将在纳L9nl达克证券交易市场上bFJM,股票代码为“FFIE”。6月25日,FF宣布,美国证监会同意了其与PSAC的合并计划,FF提交的最新版美股上市招股文XxILS4已经正式生效。在获得PSAC股东的批准并满足其他惯例成CRmX条件后,双方正式合IRgQ交易将在7月20日完成,并在7月21日纳斯达克挂牌上市。按nTRg双方此前的协议,完成合并后公司估值达到34亿美元,折合人民币220亿元。企查查APP显示,至今,FF已完成11轮融资。FF91能否实现贾跃亭的造成梦有待商榷,fBQR实是,贾跃亭已多次6INl被执行人。企查查显af4g,近日,贾跃亭被强7pMX执行1413517950元(约14亿人民币),执行案号(2021)京03执恢246号。
卷积神经网络(convoluitonalneuralnetworks,CNN)凭借强大的卷积和池化(pooling)能力,在计算机视觉领域占领iQBQ导地位。而最近Transformer架构的兴起,开始在图像和视频识别任MtEt中与CNN「掰头」。特别是视觉Transformer(ViT)。Dosovitskiy等人的研究已经展示了将图像解释为8gj7系列类似于自然语言中的HTYs词的标记(token)。在ImageNet基准测试中,以较小的FLOP实现可比的分类精度。现在tSmg管ViT及其变体仍然处于起步阶段,但鉴于ViT在图像识别方面表现出对竞9Uwx性,以及需要较少的视觉Du8n定归纳偏差,ViT能不能扩展应用到图像生成呢?lV0X谷歌和加州大学圣地亚哥wrWP校组成的研究团队对这个RUnH题进行了研究,并发表了cLpR文:ViTGAN:用视觉Transformer训练生成对抗网络(GAN)。△https://arxiv.org/pdf/2107.04589.pdf论文研究的问题是:ViT是否可以在不使用卷积或池化的情况下完成图像DG4K成任务,即ViT是否能用具有竞争质量的GAN训练出基于CNN的GAN。研究团队将ViT架构集成到中GAN中,发现现有的GAN正则化方法与自我注意机制的交互很差,导致训DfjR过程中严重的不稳定。因w6NW,团队引入了新的正则化p200术来训练带有ViT的GAN,得出以下研究结果:1.ViTGAN模型远优于基于Transformer的GAN模型,在不使用卷积或池化的情况下,性7M0o与基于CNN的GAN(如Style-GAN2)相当。2.ViTGAN模型是首个在GAN中利用视觉Transformer的模型之一。3.ViTGAN模型展示了在标准图像生成基准(包括CIFAR、CelebA和LSUNbedroom数据集)中,这种Transformer与最先进的卷积架构具有可比性的方法。实验方法QvjV图说明了ViTGAN的架构,包括一个ViT鉴别器和一个基于ViT的生成器。实验发现,直接使用ViT作为鉴别器会使训练变得不稳定。作者对生成器和TT8c别器都引入了新的技术,IRsh来稳定训练动态并促进收vbGo。(1)ViT鉴别器的正则化;(2)生成器的新架构。由于现有的GAN正则化方法与self-attention的交互很差,在训练过程中导致严重的kabv稳定。为了解决这个问题iIab作者引入了新颖的「正则kRcg」技术来训练带有ViT的GAN数据集上实现了与最先进的基于CNN的StyleGAN2相当的性能。利普希茨连续(Lipschitzcontinuity)在GAN鉴别器中很重要,首先它作为WGAN中近似Wasserstein距离的一个条件而引入注意力,后来在其他GAN设置中被证实超出了Wasserstein损失。特别是,证明了Lipschitz鉴别器保证了最优鉴别函数的存在以及唯一纳H6Pi均衡的存在。然而,最近1PI5一项工作表明,标准dotproductself-attention(即Equation5)层的Lipschitz常数可以是无界的,使Lipschitz连续在ViTs中被违反。如Equation7所示,实验用欧氏距离代替点积相似度,query和key的投影矩阵的权重也是一样的。实验发现,zbgz初始化时将每层的归一化wCYc重矩阵与spectralnorm相乘就足以解决这个问题。实验用以下的更i3Fi规则来实现spectralnorm,其中σ计算权重矩阵的标准spectralnorm.设计生成器设计一个基于ViT架构的生成器并不简单。一个挑3nDl是将ViT从预测一组类别标签转换为在一个空间区uI9w内生成像素点。在介绍实p0iv模型之前,作者先讨论两0cVP可信的基线模型,如Fig.2(A)和2(B)所示。这两个模型交换ViT的输入和输出,从嵌入物中Fy5e成像素,特别是从潜伏向1m55w,即w=MLP(z)(Fig.2中称为映射网络),由MLP从高斯噪声向量z中导出。这两个基线生成器在输入序列上有所不2f8j。Fig.2(A)将一个位置嵌入序列作为输入位Q1fo嵌入序列,并在每个位置BhoX入中加入中间特征向量w.实验结果△ViTGAN与基线架构关于图像合成的vAAd要结果对比TransGAN是现有唯一一个完全建立在Transformer架构上的无卷积GAN,其最佳变体是TransGAN-XL。Vanilla-ViT是一种基于ViT的GAN,它使用图2(A)中所示的生成器和一个vanillaViT鉴别器。为公平比较,该基线使K4Xk了R1penalty和bCR+DiffAug。此外,BigGAN和StyleGAN2也作为最先进的基于CNN的GAN模型加入对比。从上述表格可z3g4看出,ViTGAN模型大大优于其他基于Transformer的GAN模型。这是在Transformer架构上改进的稳定GAN训练的结果。它实现了与最先进的基于CNN的模型相当的性能。这一结果uklF供了一个经验证据:Transformer架构可以在生成对抗训练中与卷积sOec络相媲美。如上图所示,ViTGAN模型(最后一列)显着提高了最佳Transformer基线(中间列)的图像保真度。即使oU5GStyleGAN2相比,ViTGAN生成的图像质量和多样性也相当。总结FJGt篇论文介绍了ViTGAN,利用GAN中的视觉Transformer(ViTs),并提出了确保其训练稳定性和提高收敛性的QrGS本技术。在标准基准(CIFAR-10、CelebA和LSUNbedroom)上的实验表明,提出的模型实现了与最先进的基tQezCNN的GAN相媲美的性能。至于限制,ViTGAN是一个建立在普通ViT架构上的新的通用GAN模型。它仍然无法击败最好kyVK基于CNN的GAN模型。这可以通过将先进的训练HWO1术纳入ViTGAN框架得到改善。希望ViTGAN能够促进这一领域未来的fxv0究,并可以扩展到其他图3BpP和视频合成任务dNCU
7月15日消息,据国外媒体报道,当地时间14日,欧盟提出了一项名为Fitfor55的计划,旨在到2030年,欧盟的碳排放量将比1990年的水平减少55%。方案包括十二项立法建议,总体目标是在2050年前实现欧盟碳中和。这一声明开启了预计为期两年的进程CCpk在此期间,欧盟各国政府和欧E9y2议会将就提案的细节和雄心展sQ07争论。根据提议,到2035年,欧盟将不再生产内燃机汽车T3YM无论是汽油还是柴油动力汽车cT3c包括混动车,较此前2050年的规划大幅提前。届时,欧盟QPIh将终止对汽车制造商过渡到电qISZ汽车的财政和激励措施。根据plvy划,到2030年,所有登记注册的新车的排放总量较2021年降低55%。欧盟官员也承认,目前只有22.6万个充电点,其中大部分位于荷兰、法国j4g6德国,提议欧盟各国大规模推4Xil、建设电动车充电和氢能加油3KMj的基础设施;各国拓展城区交R0mi加油充电的基础设施;每隔60公里应配置一家电动车充电站Ydb3每隔150公里应设置氢能加油站。各国汽车行业对此态度大YMEn不同,德国机动车协会VDA持批判态度,认为欧盟的减排决TJ9n过于苛刻,不利于汽车产业的90NC主发展gG4K
7月12日消息,今日,联合国工业发展组织投资和技术促进办公ZrvW(中国·北京,UNIDO ITPO Beijing)和腾讯集团共同举办的“第四次工业革命LAYV术促进产业帮扶与乡村振兴”系2bfJ培训启动仪式在北京举办。腾讯vXt9团与UNIDO ITPO Beijing共同发起的“第四次工业革命技术促进产业帮扶与乡村ymQY兴”系列培训活动,旨在通过虚DtYs现实(VR)、社交网络、线上课堂、智慧零售等创新培训工具和hzlH式,聚焦职业教育,助力青年和bHp0小微企业等群体,使其获得就业zCkt再就业的技能,更好地应对“数XAAU鸿沟”和新冠疫情背景下的风险jeRV挑战,促进产业帮扶,助力乡村AQkc兴。今年5月14-15日,由国家发展改革委与河北灵寿县政府X2W4持,该培训在河北省灵寿县落地AkxC第一站。培训融合了腾讯微信、1dij讯课堂、腾讯智慧零售等业务,GiIj当地数百名学员提供了深度接触zE2I字化就业技能的机会。未来双方PQGS划继续将此系列培训推广到陕西KjxO安、浙江义乌、安徽砀山、四川urRW格等全国其他地区如,及部分发S0lm中国家如柬埔寨、老挝、阿塞拜Yx4w、土库曼斯坦等,并组织推动在fEim有国际影响力的平台上进行更广3XXp的知识分享。腾讯集团市场公关u6Jz总经理张军在致辞中表示,腾讯Yvns乡村振兴的行动者。今年四月,4kwW讯集团再次启动战略升级,设立K1cH持续社会价值事业部,并首期投0nnk500亿元用于可持续社会价值创新,在教育创新、公益数字化等MRIP域展开探索,寻找将互联网科技NVow乡村实际密切融合的路径与模式eUOL配合国家乡村振兴的伟大工程。dR8V随全球数字科技的发展,社会生VfSW、消费形态和就业格局都发生了V69N大的变化。越来越多与数字化相0Dv8的新职业、新工种不断涌现,据nY4s完全统计,2020年,微信生态蕴含的就业机会达到3684万个。本次系列培训将整合腾讯旗下1IeR信、腾讯课堂、智慧零售、腾讯s5Nm等多条业务线资源。张军称,我DBmM希望通过此次与联合国工发组织wxO0地方政府的携手,能为疫情之后jIru国际减贫,和乡村振兴工程贡献xYJ8有价值的中国数字样本,为就业v7rd口拥抱数字经济打开新的窗口zyJC
7月20日消息,据国外媒体报道,中国汽车信息网(CAIN)的最新数据显示,今年6月份,特斯拉在中国生产的汽车(Model3和ModelY)注册量为28508辆,环比增长29%,这是因为接近季度末的促销活动(包括优惠贷款和全Av2A预付折扣)帮助抵消了围绕客C9PJ投诉和质量担忧的一系列负面Ra4S道。在这28508辆汽车中,Model3的注册量为16995辆,ModelY的注册量为11513辆,环比下降10%。自从进入中国市场以来,特斯拉一直是中国最受欢迎的电BXbe汽车品牌之一。从全球范围来Xroi,中国市场已经证明给特斯拉ufGl来了大量需求。目前,特斯拉mErT其位于上海的超级工厂内生产gpr8产Model3和ModelY。自2020年1月首次交付以来,国产Model3一直是中国最受欢迎的汽车之一。特斯Kk0gModelY于2021年1月1日首次进入中国市场,并于今年1月18日开始在中国交付。尽管ModelY在中国才上市几个月,但这也并没有影响它vToe为市场上最受欢迎的电动汽车0trX一。乘联会(CPCA)公布的数据显示,今年5月份,特斯拉中国共售出21936辆电动汽车,其中ModelY售出12728辆,Model3售出9208辆。今年6月份,特斯拉中国售出了11513辆ModelY和17017辆Model3。





