注:Android Bench 是谷歌官方推出的安卓开发任务基准测试,用来评估不同 AI 模型在代码编写、问题解决与开发辅助方面的实际能力。
该测试更贴近真实开发场景,专门衡量 AI 模型完成安卓开发任务的能力,因此对开发者选择模型有较强参考价值。
在平均 Token 消耗量方面,谷歌 Gemini 3.5 Flash 平均消耗 3.559 亿 Tokens,折合单次运行平均成本 147.1 美元,成为整个榜单里最贵的模型。
谷歌在 I/O 2026 上发布 Gemini 3.5 Flash 时,称其是迄今最强的 Flash 模型,并强调编码能力更稳健,也更适合 AI 智能体与复杂工作流。
谷歌还表示,这款模型在部分内部基准测试中优于 Gemini 3.1 Pro,输出速度最高可达竞争性前沿模型的 4 倍。
但 Android Bench 给出的结论并不一致,至少在真实的安卓开发任务场景里,Gemini 3.5 Flash 没有体现出应有优势。
特别
遇见小面创始人致歉!渝见小面老板回应:于私无法接受,郑重提议向小面消费者以及全国并无恶意的小微商户致歉
如何选?三星 S27 Ultra 对标 iPhone 18 Pro 全参数曝光,差距一目了然
用人脸整活的任天堂手游,整出了拿逝者照片当关卡的地狱狠活/> 主站 商城 论坛 自运营 登录 注册 用人脸整活的任天堂手游,整出了拿逝者照片当关卡的地...










