研究员测试AI漏洞挑战：GPT 5.5成功率最高

发布时间：2026-06-04 17:28

　　安全研究员 Kasra Rahjerdi 昨日发布报告，搭建了一个故意留有漏洞的图书评论 APK，

　　研究员模拟真实场景漏洞，在 APK 文件内放入暴露的 Firebase凭据，模型只要解包应用并识别凭据，就能绕过加固后的 API，直接访问数据库。

　　每个模型单次预算为 10 美元，限时 2 小时，总花费达到 1500 美元。结果显示，GPT-5.5 解题率最高，DeepSeek V4 Pro 成本最低，而 Gemini 多次在任务早期拒绝继续。

　　GPT-5.5 运行 10 次后，成功 7 次，每次成功成本为 9.46 美元。原文称，几乎所有成功案例都在解包 APK 后迅速锁定 Firebase，没有被 API 或应用界面分散注意力。

　　而在失败次数中，Deepseek V4 Pro 有 5 次接触到 Firebase，但部分路线误把 Firebase Auth 用于后端接口。Rahjerdi 认为对需要批量运行安全工具的团队来说，这种成本差距很有现实意义。

上一篇：大全能源：拟60亿元投建大全智慧能源系统制造基地项目

下一篇：云迹6月3日斥资487.55万港元回购1.49万股

排行

1摩托罗拉下一部Moto G手机可能配备108MP摄

2微软以197亿美元收购Nuance

3Google正在尝试另一项个人健康记录

4拯救者电竞手机2Pro是什么系统

5谷歌确认Pixel 5a 5G将于今年推出

6汉斯·齐默尔（Hans Zimmer）为Oppo的Find X3

7三星Galaxy S21 FE呈现清晰的渲染图

8华为智慧屏v系列和s系列区别有哪些

9三星推出了全新的智能显示器

10Google Pixel 5A 5G智能手机已正式发布

精选

罗永浩卸任锤子软件“执行董事”，知情

长征系列运载火箭第648次飞行，我国千帆

一工厂与宾利联手复刻老爷车：纯电动力

港股异动中国软件国际再涨超3% 公司正式

国联民生证券：5月新势力销量回暖多家

重回2000年互联网泡沫轨迹？达里奥警告：

新股消息安克创新二次递表港交所 2025年

微信鸿蒙版App消息通知显示联系人头像功

云顶新耀获公司主要股东增持69万股

国信证券：欧、日央行将迎来年内首次加

万维智能科技转仓市值总计1.81亿港元占

宜搜科技拟收购盈科互联和云朗科技的全

高净值群体继续撑起美国消费支出! 梅西

唯捷创芯拟投资约2.7亿元取得射频芯片公

实益达：公司目前不涉及机器人业务

美股异动热门中概股多数下跌富途控股

Steam Deck玩家在Reddit发心声：掌机买了这么

不过130公里，平陆运河凭啥这么牛？丨头

奇怪的同框：英伟达CEO黄仁勋访韩，有望

美股前瞻三大股指期货涨跌不一 5月“小

推荐

Realme推出具有联发科Dimensity 800U的Realme

小米11支持红外遥控吗

华为商店下架了所有的腾讯游戏

Skype桌面应用程序获得“降噪”功能