8月29日,据彭博社报道,谷歌宣布将重新启用其人工智能模型Gemini的人物图像生成功能,部分订阅了Gemini Advanced套餐的英语用户将能够再次使用这一功能。此外,企业用户也将能够利用这一工具,预计在未来几天内全面上线。
谷歌产品管理高级总监戴夫·西特伦(Dave Citron)表示,公司在通过Imagin 3生成人物描述方面取得了显著进展。他提到,团队一直在努力提升产品的技术性能,并改进了评估集、红队练习以及明确了产品原则。尽管Gemini生成的图像并非完美无瑕,但公司将继续收集早期用户的反馈,不断优化用户体验。
所谓“红队练习”,是指在产品正式发布前,通过模拟使用来发现其潜在风险。西特伦强调,用户将无法生成过于真实的图像、可识别的个人肖像、未成年人的形象,以及涉及血腥、暴力或性场景的内容。
回顾此前事件,今年2月,谷歌的图像生成工具曾因生成的人物图像存在历史不准确的问题而遭到批评。例如,在生成“美国开国元勋华盛顿”主题的图片时,出现了女性和有色人种的形象。此外,一些用户指出,Gemini在处理白人形象时显得异常谨慎,甚至难以生成相关图像。为此,谷歌于2月22日宣布暂停Gemini的人物图像生成功能,并致力于解决相关问题,计划在不久后重新推出改进版本。
谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)在今年MWC 2024的一次小组讨论会上也提到,公司已暂时停用了Gemini的人像生成功能,并正在积极修复问题,预计在未来几周内重新上线。随着此次更新,谷歌显然希望能够在保证内容准确性的同时,进一步提升用户的使用体验。