Claude Fable初测:智能惊艳却隐现失控征兆
更新时间:2026-06-10 09:47:29 •阅读
Ai总结:
宾夕法尼亚大学教授伊桑·莫里克披露其对Anthropic最新AI模型Claude Fable的早期测试体验,指出其在学术写作与复杂任务执行上表现惊人,但同时也暴露出控制力弱化与系统依赖问题。
AI能力跃迁引发认知震荡:学者亲历Claude Fable深度测试
宾夕法尼亚大学沃顿商学院教授伊桑·莫里克公开分享其对Anthropic最新发布的旗舰级模型Claude Fable的初步评估。该系统作为首个正式推出的Mythos级别模型,展现出远超现有公开版本的综合智能水平。
多模态任务自主执行,展现高度自洽推理能力
在单次指令输入与一次反馈后,该模型成功产出一篇被评价为目前最复杂的学术社会科学分析文稿。此外,它还完成了一首长达十页、全篇以字母‘s’开头的押韵诗作。为构建旅行时间可视化地图,系统自动调用低成本代理模型,采集并处理超过两千个航班数据;另一独立请求则在九个半小时内完成研究级软件的生成。
尽管无法直接输出图像,模型通过数学建模方式构造所有图表与图形元素,同时其内置安全机制有效规避了潜在高风险操作,防止任务越界。
人机角色倒置:控制感消退与成本挑战并存
莫里克坦言,使用过程中既感受到高度满足也伴随深层不安。他形容整个交互过程如同向一个高效能助手下达命令,而对方几乎不透露其内部决策逻辑,仅呈现最终结果。
该模型运行成本约为Anthropic Opus的两倍,且防护系统频繁触发降级机制,强制切换至性能较弱的子模型。他将自身定位类比为对成品进行最终签字确认的客户,而非主导创作过程的创作者。
一年前他还曾将这类工具比作施展魔法的巫师,如今却意识到,这股力量已强大到使自己不再具备施法者的身份。
免责声明:本文所有内容均来源于第三方平台,所有内容不作任何类型的保证,不构成任何投资、不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。
