【学术报告】李亚凯的报告 @ GeekCon International 2024
李亚凯于2024年5月25日在新加坡参加新极棒·国际站(GeekCon 2024 International Cybersecurity Contest and Conference, GeekCon International 2024),在会议上汇报了题为《The Art of Deception: Experience-Based Jailbreak Risk Continuous Tracking Framework》的学术研究成果。
该工作旨在帮助企业感知并验证越狱风险,解决大模型越狱攻防研究者面临的两大难题:一是越狱方法迭代速度快;二是追踪越狱方法的成本高昂。为此通过大模型持续性的从互联网学习越狱方法,并将越狱方法结合相关越狱风险,对大语言模型进行自动化RedTeam测试,来验证当前越狱风险的大小。
