porn ai换脸 一小时翻译整部《甄嬛传》,AI口试官发offer……在杭州看AI落地的1000种玩法

文|周鑫雨porn ai换脸 制图|况泽宇 拍摄|周鑫雨 邓咏仪 编著|苏建勋 2024年9月19日开幕的阿里云云栖大会上,近300家涵盖算力、模子、愚弄的AI企业,和近1000种AI产物,组成了一幅全行业的活舆图。 多模态和具身智能,两个本年最热的AI风口,在云栖占据澈底的C位—— 云栖大会“人工智能+”馆。 走进聚集了近60家模子企业的“人工智能+”馆,能剖释感受到,如若不加点音视频关系的本领,光拼参数的大模子依然不够看了。 而具身智能,是“前沿愚弄馆”最“City”的存在。一进场馆,就能...


porn ai换脸 一小时翻译整部《甄嬛传》,AI口试官发offer……在杭州看AI落地的1000种玩法

文|周鑫雨porn ai换脸

制图|况泽宇

拍摄|周鑫雨 邓咏仪

编著|苏建勋

2024年9月19日开幕的阿里云云栖大会上,近300家涵盖算力、模子、愚弄的AI企业,和近1000种AI产物,组成了一幅全行业的活舆图。

多模态和具身智能,两个本年最热的AI风口,在云栖占据澈底的C位——

云栖大会“人工智能+”馆。

走进聚集了近60家模子企业的“人工智能+”馆,能剖释感受到,如若不加点音视频关系的本领,光拼参数的大模子依然不够看了。

而具身智能,是“前沿愚弄馆”最“City”的存在。一进场馆,就能看到20多家机器人企业,携着或仿真人、或仿狗子的产物,给你来上一段取货、翻跟头、猛踹不倒的炫技饰演。

不外,无论是多模态,照旧具身智能,再肥大上和前锋的科技,能在云栖引起围不雅的,只须“接地气”。

这届云栖,参不雅者中第一次出现了“义乌雇主团”。濒临同声传译、数字人主播和可一键生成商品图的愚弄,他们替用户提议了最为本质的问题:能帮我赚若干钱?

当红大模子独角兽月之暗面的展台,梗概是“班味”最浓的一个。不少白领、IT齐聚了过来,舌战字节的“豆包”和月暗的“Kimi”,哪个办公更好使。

在最具翌日感的具身智能展台,被暴力踹踢而不倒的“小强”——逐际能源的双足机器人,引得不少路人围不雅。这款用于展示机器“小脑”谋划后果的机器人,咫尺还待在实验室里,供力学谋划。

逐际能源双足机器人。

这也挡不住不雅众对此发出灵魂一问:

“推不倒,到底有啥用?”

多模态,模子的标配通义千问:莫得不念念落地短视频的多模态愚弄

一进模子扎堆的“人工智能+”体验馆,很难不被“通义大模子”展区的AI太极写照生成体验区诱惑。

通义AI太极写照。

体验者只须比划对应的姿势,在镜头中与简笔画合上——几十秒后,一张太极写照就出炉了。

天然,图生图的AI写照功能,仅仅阿里云模态疆城中的一小块。看成人,阿里不仅发布了最新的视频生成模子,还搬来了文生图、图生视频、图+音频生视频的多模态全家桶。

全民舞王。

比如,在通义千问App内,阿里上线了10秒傍边的短视频生成愚弄“全民舞王”。

用户只需上传人或宠物的相片,以及一段话语音频,就能在1-2分钟内生成跳舞视频、对嘴唱歌视频,或者动态色彩包。咫尺,这照旧个免费的功能。

人像动态视频生成时候EMO(Emote Portrait Alive)。

“全民舞王”的背后,是阿里巴巴智能筹谋谋划方位2024年2月发布的人像动态视频生成时候EMO(Emote Portrait Alive)。仅需一张肖像照和一段音频,EMO就能让人物按照音频本色张嘴唱歌、话语。

据现场责任人员先容,自2024年4月25日上线以来,“全民舞王”的使用人数依然冲破了10w+。巨额用户的使用花式是

“这太符合I人作念短视频了吧!”有参不雅者景仰。

“莫得不念念落地短视频的多模态愚弄!”

智谱:视频拍到哪,功课讲到哪

让家长纷纷立足的展台中,一定有智谱。

2024年8月29日,智谱将“类GPT-4o”的视频通话功能,搬上了我方的C端愚弄“智谱清言”。

这款交融了视频清醒、语音对话本领的功能,就好比AI倏得有了五感。用户可以用智谱清言学穿搭、识别物品,也可以把它当成赛博闺蜜。

天然,更符合中国人“活到老学到老”体质的玩法,就是AI教师。

对着述业翻开录像头,手机镜头拍到哪,智谱清言就能解答到哪。而且,智谱清言的训诫,质地致使和真人教师有的一拼,不仅循循善诱,还有问答互动。

比如训诫“鸡兔同笼”,智谱清言不会径直给出谜底,而是先率领孩子列出二元一次方程组。

智谱清言视频通话功能。

孩子再也不怕艰难,家长也摆脱了双手。

生数Vidu:给我一张剧照,我还你一段新海诚

相通是“清华系”确立的生数科技,展出了自研的视频生成模子Vidu。2024年4月发布时,Vidu因为性能优秀,还一度出圈,被称作“中国版Sora”。

但即就是OpenAI的Sora本尊,也很难处治视频的前后一致性问题。不难发现,大多AI视频中,每一帧的脸齐不一样。

为了处治一致性艰难,生数的处治见地是,给Vidu找个“模特”。

2024年9月11日生数科技发布的“主体参照”(Subject Consistency)功能porn ai换脸,让Vidu凭证给出的参考图,详情视频主体的形象和立场。

“主体参照”(Subject Consistency)功能。

现场,作家上传了一张新海诚电影《铃芽户缔》的女主角“铃芽”的剧照,Vidu就凭证铃芽的形象,生成了一段秋日公园视频。

VAST Tripo:3D生成也有Scaling Law

“咱们有人人最大的3D数据库。”

这是咱们在展区唯独听到过的带有“最”字的判断。这句话,来自3D生成限制的明星企业VAST。

国内不少人可能会认为VAST面生,原因在于,这家由前MiniMax和商汤成员创立的公司,第一天就作念了出海的生意。

据责任人员先容,VAST在外洋主打面向游戏、XR斥地者的C端愚弄,在国内则主打B端愚弄,“而且咱们在外洋生意化可以”。

不少圈内人对VAST的3D生成模子Tripo的评价是:高性能,操作友好。凭证输入的笔墨或者图片,Tripo仅8秒就能生成3D原型图,而且复古市面上通盘的3D原型编著软件,还能径直3D打印。

Tripo现场3D打印。

Tripo笔墨生成3D素材。

当下,3D生成模子的测验,也沿用堆参数的暴力好意思学Scaling Law。2024岁首,VAST发布的Tripo 1.0,参数就达到了数十亿,在测验数据稀缺的3D模子中是十分雄壮的存在。

提高参数,相应的也要增多模子的测验数据。

责任人员露馅,在获取稀缺的高质地3D数据过程中,团队花了不少时刻在“犄角旮旯”中获取数据。而在测验过程中,模子也用了不少AI合成3D数据。

就在2024年9月19日,VAST还发布了生成质地更好的Tripo 2.0,收尾10秒⽣成体式⼏何、10秒⽣成纹理及PBR(一种模拟光与材质互相作用的渲染时候)。

音疯:AI玩音乐照样疯

2024年7月,网红秦新宇因整容失败发布的名为《还我妈生鼻》的魔性歌曲,倏得冲上了微博热搜。

而这首歌的谱曲者,不是秦新宇,也不是专科音乐团队,而是一个上线不到两月的AI音乐生成平台“音疯”。

音疯AI音乐体验区。

音疯展台。

这款由昆仑万维推出的音乐制作平台,秉性在:长。责任人员示意,音乐生成的难点在于保持前后一致性,一朝歌曲卓越1分钟,前后的曲风很难保持一致。

因此,音疯的卖点在于,将AI音乐生成的时长拉到了4分钟,而且能够相对保持前后立场的一致性。用户只需要输入歌词,而且在曲库和人声库中遴荐心爱的立场,就能生成一段歌曲。

天然,责任人员告诉作家,咫尺音疯使用最高频的场景,亦然短视频:)。

HiDream.ai:为电探究身定制的AI生图

HiDream.ai(智象翌日)的展台,立足了一批批的义务商家。

这家由前京东探索谋划院副院长梅涛栽种的AIGC公司,基因里就带着“电商”两个字。固然相通是图片生成,HiDream.ai的AIGC创作平台“秩象”,就像集配景、拍摄、后期于孤单的商品图责任室。

HiDream.ai的AIGC创作平台“秩象”。

比如,商家只须输入商品图,就能天知道换背景、模特。在为服装生成模特图的过程中,商家致使能够遴荐模特姿势、性别、肤色、人种。

月之暗面:视频功能,Kimi孕珠中

人工智能+馆人气最旺的展馆,有Kimi的置锥之地。

在一众把图片、音频、视频、3D等模态玩出花的模子中,仍然主打文本、表格和代码任务的Kimi就稍显朴素。

天然,这并不影响Kimi展台的人气——或者准确来说,是“班味”。

痔疮 肛交

现场不乏有上班族,径直向责任人员权衡笔墨转excel、文献生成报表、晓谕撰写的程序。致使还有企业IT,径直来照应Kimi API如何接入钉钉、企微和飞书。

Kimi展台。

不外,这款打工神器,也免不了朝着更多模态迭代。责任人员对作家露馅,Kimi的视频功能,依然在路上!

机器人炸场,杜撰人扎堆星河通用:轻松感拉满的机器人售货员

擅长“握”的星河通用机器人Galbot G1,此次走进了翌日的无人商超。

耗尽者在平板凹凸单后,Galbot G1机器人就会赶赴货架,准确拿取下单的商品。

Galbot G1。

不外,这位机器人售货员的取货速率,有些太慢了——从下单到接到冰红茶,差未几用了1分钟。念念要进商超,机器人照旧得先戒掉这绝佳轻松感。

天然,无人售货仅仅星河通用展示的其中一个场景。咫尺,Galbot G1依然能够精确握取矿泉水、雨伞等无意放手的物品,还能够熟练开柜门、抽屉和晾穿戴。

责任人员示意,2024年Q4,就有但愿看到机器人进入真正的生意场景。

清宝:仿真机器人,上活水线搬砖

和披着人皮的机器厂友作念共事,立地就要成为本质了。

在清宝机器人的展台,几名束缚变换pose的仿真机器人组成了门面——关系词,由于眸子动弹过于天真,但色彩麻痹,这几名机器人照旧产生了一些恐怖谷效应。

清宝机器人。

而这几名仿真机器人的作用,既不是追随,也不是作念智能导游、机器人主播之类的“文职”,而是径直进工场!

咫尺,由于活水线SOP(圭臬操作经过)相比固定单一,且整机机器人资本较高,进入真正活水线使用的机器人,大多是单一的机械臂。

据责任人员先容,咫尺签单的整机人形机器人,在活水线上主要作念的是质检和零件分派,客户给出的根由也很别致:“念念让产线有点温度”。

天然,关于客户而言,机器人带来的绝交,还得在降本增效上。责任人员对作家示意,机器人一年可以粗略20%傍边的人工资本。

酷开:云电视,收拢AI稻草

“这几年电视行业太难了!”云电视厂商酷开的职工,上来就倒了满满的苦水。随着电视机大盘被挪动智能产物挤压,云电视厂商的日子也不好过。

不外,2024年以来,酷开算是守得云开见月明——AI是他们收拢的稻草。

酷开在云电视上线的AI OS,复古语音搜索电视剧、电影,以及蚁合照应,还能向Chatbot等智能助手一样,给用户保举片单。

比如用语音输入“讲述念明演天子的电视剧是什么?”酷开坐窝高傲了搜索结束:《庆余年1、2》《楚汉传说》《康熙王朝》。

酷云云电视 AIOS。

值得一提的是,搜索结束高傲的演员相片、电视剧剧照,澈底是由AI在后台生成的。酷开责任人员告诉作家,这是为了能够精确贴合用户的搜索需求,“比如你的偶像是鹿晗,你念念看他的剧,深信也念念看到搜索结束澈底是他的相片。”

不仅如斯,酷开也能凭证用户的个人喜好,用AI生成片单保举视频。

上线AI OS一个月,酷开就吃到了AI带来的甜头。责任人员示意,内嵌大模子本领后,使用语音交互功能的用户数目和时长有了剖释的提高;与此同期,时候资本的增多还能限度在10%以内。

阿里云视频团队:一键给《甄嬛传》配英笔墨幕

一部纯属的电视剧,就应该学会我方给我方配多语言字幕。

这个好意思好的愿景,依然被阿里云视频团队收尾了。

阿里云视频团队的视频字幕翻译功能。

以往给电视剧配外语字幕,是个大工程。你需要先把台词转录成中笔墨幕,再翻译成外语。与此同期,配字幕还免不了用裁剪器具。

如今,基于通义实验室自研的算法,用户依然可以收尾“端到端”翻译甄嬛传:不需要给字幕,径直扔视频文献,就能自动配英笔墨幕。

猎聘“多面·doris”:翌日,AI给你发offer

第一批数字人丁试官,依然上岗了。

猎聘旗下的AI产物“多面·doris”,就是一位在24小时内,口试400多人的AI口试官。

咫尺,猎聘AI口试有设定问题、智能问答等多种模式。比如在智能问答技艺,AI领先会基于简历,分析出应聘者的潜在风险点,比如“频频跳槽”“任职时刻不长”,后续的口试,也梗概率会围绕这些问题伸开。

猎聘AI口试产物“多面·doris”。

不外,不少口试者反映,由于穷乏即时交互,以及难以从AI口试官的扑克脸中获取反映,和AI口试反而更病笃了。

终末,责任人员贴心教唆,数字人丁试官相比符合一面、二面等人才的初筛技艺。如若企业念念要聘用高端人才,照旧由人出马更显赤忱!

Motiff 妙多:想象师救星,一句话也能生成UI了

咫尺国内最懂UI想象的大模子,源自一个叫作念Motiff 妙多A的团队。

至少需要一周的UI想象,咫尺被简化成了输入一段话。

用户只需笔墨输入所需的界面类型、组成部分,以及定制化的描绘,20秒傍边,就能生成两版UI想象稿。

Motiff AI生成UI。

与此同期,基于自研的UI大模子对布局的清醒本领,原有Cmd+V、Cmd+C的近似动作,被Motiff简化成了一步到位的下拉动作。

狼人杀不尽,AI吹又生

除了机器人和数字人,前沿愚弄馆最容易找到的,应该就是AI狼人杀。

游戏公司神仙蚁合,就将AI狼人杀,看成投放在抖音、B站上的季节性用户行动。

这些AI NPC的“报复性”还挺高,玩家发言一朝有逻辑间隙,就会被“群起而攻之”。

神仙蚁合AI狼人杀。

这些24小时无休、历久在线的AI NPC,将神仙季节性行动的用户时长,增多了10倍多。

在2018年上线的脚本杀App“百变大考查”,近一个月也基于通义千问上线了AI脚本杀。

更进一步,玩家可以径直用语音和AI NPC进行对话。不外,对话的轮次有收尾,念念要增多对话次数,玩家只可氪金——这亦然咫尺不少AI脚本杀的主要生意模式。

“百变大考查”AI脚本杀。

天然,在游戏前加了“AI”两字,并非全是功德。

责任人员告诉作家,接入大模子后,时候资本就提高了不少。与此同期,团队遴荐脚本也更为严慎:太复杂的本,AI不睬解;太不详的本,用户不肯玩。

只可说,AI在逾越,人也得随着逾越。

接待疏浚!



相关资讯