7月6日消息,在2024世界人工智能大会期间,快手举办了以“新AI·新应用·新生态”为主题的大模型论坛,会上,快手大模型首次集体亮相,视频生成大模型可灵、图像生成大模型可图等产品的多项新功能正式发布。
继图生视频、视频续写功能发布之后,可灵在一个月内迎来了第三次重大升级,网页端正式上线。在本次论坛上,可灵推出更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能,同时,创作者单次生成的文生视频时长增加至10秒。图像生成大模型可图则宣布正式开源,这一举措旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。
一直以来,AI技术创新都是推动快手发展的驱动力,不仅覆盖内容生产、理解、推荐等多个层面,也持续推进着快手商业生态的智能化经营水平。快手高级副总裁、主站业务与社区科学线负责人盖坤表示,快手未来将继续加大在AI领域的投入,大力推动技术创新,“坚定地为用户做最好的AI技术”。
快手大模型首次集体亮相 用AI重塑内容理解、分发与生产环节
盖坤介绍,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等多个层面,并深度服务快手的商业生态场景。其中,快手的推荐大模型SIM,凭借十万亿参数的规模,成为全球领先的推荐系统之一,其下一代架构ACT预计每日将为快手App增加4亿分钟的用户观看时长,显著提升用户粘性和活跃度。
“坚定大模型技术投入与创新,坚持在真场景中挖掘真价值,满足用户的真需求”。快手副总裁、大模型团队负责人张迪表示,将用大模型技术重塑快手业务,通过“升级理解、创新互动、探索生成”,在内容生产方面,打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验;在内容消费领域,升级快手的内容理解和分发体系,提升用户的消费体验。
据悉,基于快意大模型构建的视频脚本生成,直播实时脚本生成、广告线索客服,叠加数字人技术,助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。快手的AIGC营销素材在今年6月达到了单日消耗峰值突破2000万的里程碑,展示了大模型在商业场景中的巨大潜力。
快手商业化外循环和AI商业产品负责人刘逍透露,半年来,有近2万商家在快手平台借助大模型能力实现智能化经营,获得不菲回报。相比今年1月,今年6月的AIGC月活跃客户数增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍。刘逍表示,磁力开创、女娲数字人、π数字员工等“新生意”工具将持续为商家深度赋能,“我们将继续深化AI技术在商业化中的应用,不断创新和发展,为客户创造更多价值。”
可灵AI推出Web端 上线首尾帧控制、镜头控制等新功能
继图生视频、视频续写功能发布之后,可灵AI在一个月内迎来了第三次重大升级,网页端也将正式上线。在本次论坛上,快手宣布,可灵AI基础模型再度升级,推出更加清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力,同时,创作者单次生成的文生视频时长增加至10s,是业内对用户开放使用可实现的最长时长。
作为全球首个真正用户可用的视频生成大模型,可灵于6月6日正式发布文生视频功能,随后又于CVPR会议期间推出了图生视频、视频续写等多项新功能,支持用户最长生成约3分钟视频。可灵以真实世界物理规则为基准,生成的视频展现出了电影级别的画质与动态效果,甚至能够模拟大幅度的物理运动,打破了传统视频生成技术的局限。这一突破性成果,不仅在国内收获了用户的广泛好评,更在海外引起了巨大反响,引发了全球对中国AI技术发展速度的广泛关注与讨论。
盖坤介绍,截至目前,已有超过50万用户申请可灵的内测资格,视频生成数量达700万。用户通过“可灵”创造的“老照片复活”等作品,因为触动人心的力量火爆全网。快手也将继续致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。
快手视觉生成与互动中心负责人万鹏飞表示,可灵AI大模型最新发布的版本中,可灵在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等七个方向的能力亮点实现进一步升级,可单次生成更高清更可控的10s及更长的视频。