美国斯坦福大学教授、美国国家工程院院士李飞飞(来源:斯坦福大学账号)
北京时间5月10日凌晨举行的Bloomberg Tech活动上,著名华人计算机科学家、美国斯坦福大学教授李飞飞(Fei-Fei Li)与彭博社Emily Change进行对话。
这场15分钟对话中,李飞飞表示,所谓担心人类被 AI 灭绝的风险被过度炒作,“这已经被夸大了”,所谓“灭绝性的危机”有点太过了。不过,她依然认为需要对 AI 模型进行限制,担忧、评估和审查这些 AI 模型。
这是外界公布李飞飞创业之后的首次参加对话活动。
李飞飞是 AI 领域的先驱性人物,也是计算机领域的华人女科学家,目前还是斯坦福大学首位红杉讲席教授、美国国家工程院院士、美国国家医学院院士、美国文理科学院院士、ImageNet的首席科学家和首席研究员、斯坦福以人为本人工智能研究院院长、AI4ALL联合创始人。她的专业领域是计算机视觉和认知神经科学。
李飞飞一直被称为“AI 教母”——源自与图灵三大“AI 教父”一样的称号。她通过开发一种名为ImageNet的大规模图像数据集在AI领域名声大噪。该数据集帮助开创了新一代能可靠识别物体的计算机视觉技术,也是ChatGPT底层技术之一。
2016年11月,李飞飞加入谷歌,担任谷歌云AI/ML首席科学家。2018年9月,返回斯坦福任教,现为谷歌云AI/ML顾问。10月20日斯坦福大学以人为中心的AI计划开启,李飞飞担任联合负责人。
此前报道称,她创立了一家“空间智能”企业,并完成了种子轮融资。投资方包括硅谷风险投资公司 Andreessen Horowitz(a16z)、加拿大基金Radical Ventures等。但在对话中拒绝谈论此事。
李飞飞强调,她看到越来越多的女性,和多样化背景的人进入科技和人工智能领域,多样化背景人员将有可能成为杰出的思想家、创新者、技术人员和教育家,发明家,科学家。因此她完全接受“AI 教母”这个称号。
以下是李飞飞对话全文:
欢迎李飞飞博士登台,她是斯坦福大学计算机科学 Sequoia 教授,人工智能中心联合主任。
Emily Chang: 李博士被誉为人工智能的教母。你对这个称号有何感想?这是我要提的第一个问题。
李飞飞:Emily,我自己从未自称为任何事情的教母,但当我被授予这个头衔时,我确实停下来思考了一下,我想,如果男性可以被称为某事的教父,那么女性也可以,所以我完全接受这个称号。
Emily Chang: 百分之百。
Emily Chang: 你是我们这个时代最有影响力的计算机科学家之一。你撰写了大量的学术论文。你是 ImageNet 的创造者,这个包含大量图片及其描述的数据库为现代 AI 奠定了基础。你有想象过它的影响力会有多大吗?
李飞飞:ImageNet 于 2007 年被设想出来,它可能是 AI 算法中大数据的关键转折点。从科学的角度看,我坚信大数据会从根本上改变我们进行 AI 研究的方式,但我从未想到大数据、神经网络和 GPU 的融合会催生出现代 AI,我也从未预想到从那时起的进步速度。
Emily Chang: 你经常和那些正在决定这项技术未来的人们在同一房间里,比如拜登总统,Sam Altman,Sundar Pichai,Satya Nadella。你在国会作证,你参与了各种工作小组。你对那些有权力的人,他们应该如何使用这种权力,有什么主要的建议吗?
李飞飞:Emily,很好的问题。实际上,无论我是在 K-12 夏令营,还是在斯坦福大学的 AI 导论课程中,我的信息都是一样的,那就是要认识到这项技术,它是什么,以及如何负责任和审慎地使用它。理解并接纳它,因为它是一种横跨各个领域的技术,正在改变我们的文明,推动商品流通,科学发现的快速进展,寻找治疗癌症的方法,绘制生物多样性地图,和我们一起发现新材料。但同时,也要认识到所有可能产生的后果,包括可能的非预期后果,以及如何负责任地开发和部署它。我认为,在现今的对话中,保持平衡,理性深思的声音非常重要。无论是在白宫还是学校。
Emily Chang: 现在,我不知道你会否称这为一场危机或一个转折点,但 AI 模型的训练数据正在耗尽,然后有些公司开始转向使用 AI 生成的数据和合成数据来训练他们的模型。这个问题有多严重?有哪些风险?下一步该怎么做?
李飞飞:首先,我认为 AI 模型的训练数据正在耗尽是一种非常狭隘的观点。我知道你在暗指那些消耗大量互联网数据的大语言模型,特别是那些来自网站、Reddit、维基百科等你能获取的数据。即使在谈论语言模型,我们也不应局限于此。我认为还有很多可以探索的。
我们看到,不同的数据可以用来构建定制化的模型,无论是用于新闻业还是在诸如医疗保健等不同的行业领域。其实我们并没有耗尽数据。实际上,还有很多有许多行业还未进入数字化时代。我们并未充分利用数据,不论是在医疗、环保还是教育等领域。因此,即使在语言模型这个领域,我不认为我们的数据已经用尽。
Emily Chang: 您认为现在使用 AI 生成的数据来训练模型是好事,还是这可能会让我们逐渐远离原始数据,以一种可能危险的方式进行?
李飞飞:这是个需要更深入探讨的问题。这是个好问题。AI 有很多生成数据的方法。比如在我的斯坦福实验室,我们做了很多机器人研究,对吧?机器人学习。在这里,模拟数据非常重要,因为我们根本没有足够的资源或机会去收集由人类产生的动作等等。模拟真的非常重要。这会让我们走向危险的道路吗?
我认为,即使是使用人类生成的数据,也可能让我们走向危险的道路。同样,如果我们对模拟数据的处理不负责任,或者没有进行深思熟虑,那么当然可能会使我们走向危险的道路。我的意思是,我甚至不需要特意指出。你知道有哪些是人类生成的不良数据,对吗?就像整个暗网那样。所以问题不在于模拟本身,问题在于数据。
Emily Chang: 你正在涉足热门且竞争激烈的 AI 创业领域。你正在启动一些项目,能透露一些信息吗?
李飞飞:不能。
Emily Chang: 好的。那就期待后续吧。我们就 AI 时代的信任度进行了一项调查。可以公布那项调查的结果吗?问题是,你对科技公司能否安全开发 AI 有多大的信任?我完全信任他们,0%。我持怀疑态度,所有人。一点也不信任。