Gemini 2.5 Flash Lite 以 0.05 美元、83.2% 的成功率紧随其后。而 Claude Opus 4.6 完成测试的成本高达 5.89 美元,是 GPT-5 Nano 的近 200 倍,但成功率反而低于 MiniMax M2.1 逾 3 个百分点。
Последние новости
,更多细节参见新收录的资料
比如宇树G1机器人虽然已能在遥操作下执行扔垃圾、擦桌子等任务,但暂时还不能独立自主地完成家务。
20 monthly gift articles to share