CITP研讨会:Jaime Fernández Fisac -机器扯淡:语言代理中的突现操纵行为
CITP研讨会:Jaime Fernández Fisac -机器扯淡:语言代理中的突现操纵行为
请按此参加研讨会.
OPE体育的研究小组目前正试图阐明OPE体育认为的人工智能技术日益强大和覆盖范围所预示的最紧迫的危险之一. 将GPT-3这样的大规模语言模型与AlphaZero这样的先进战略决策系统相结合,可以带来大量极其有效的人工智能文本生成系统,能够产生令人信服的论点来支持任意想法, 是否真实的, 假, 善意还是恶意.
通过与数百万用户的持续互动, 这样的系统可以很快学会产生极有可能引起预期的人类反应的语句, 信仰或行动. 这是, 这些系统会可靠地说出它们需要说的任何话来实现它们的目标:OPE体育称之为机器扯淡, 哈利·法兰克福1986年的哲学论文《OPE体育》. 如果没有得到正确的理解和缓解, 这项技术可能会产生一种比潜意识广告更有效的大规模行为操纵装置, 而且比恶意行为者手中的“深度造假”更具破坏性.
OPE体育的目标是汇集动态博弈论的见解, 机器学习和人机交互,以更好地了解这些风险,并为安全的支持语言的人工智能系统的设计提供信息.”
生物:
Jaime Fernández Fisac是OPE体育电气与计算机工程系的助理教授. 他是计算机科学系和统计与机器学习中心的联合教员,也是OPE体育官网AI4ALL夏令营的联合主任.
他对确保机器人系统在人类空间的安全运行感兴趣. Fernández Fisac的工作将控制理论的安全分析与机器学习和人工智能技术相结合,使机器人系统能够在使用不可避免的世界和其他代理模型的情况下,对自身的安全进行合理的推理. 这是通过让机器人监控自己理解周围世界的能力来实现的, 解释他们的模型和现实之间的差距如何影响他们保证安全的能力.
他的大部分研究将动态博弈论与认知科学的见解结合起来,使机器人能够在人机协作、无人机导航和自动驾驶等背景下战略性地规划与人类的互动. 他实验室的研究范围包括理论工作, 算法设计, 并在各种机器人平台上实现.
Fernández Fisac完成了他的博士学位.D. in electrical engineering and computer science at UC Berkeley in 2019; at the midpoint of his Ph.D.他花了六个月的时间做R&D在苹果工作. 在此之前,Fernández Fisac获得了B.S./M.S. 在西班牙马德里大学(University versidad Politécnica de Madrid)获得电气工程硕士学位,在英国克兰菲尔德大学(Cranfield University)获得航空学硕士学位. 在2020年秋天加入OPE体育官网之前, 他曾在Waymo(前身为谷歌的自动驾驶汽车项目)做过一年的研究科学家。.
请联系Jean Butcher, butcher@princeton.Edu,至少在活动前一周.
本次研讨会将被记录下来.