谷歌AI拼错自己名字:大模型底层缺陷曝光
谷歌生成式搜索竟拼不对自家名字?底层逻辑存在致命盲区
尽管被定位为未来搜索的核心,谷歌的AI概览系统在面对最基础的拼写判断时仍显力不从心。近期测试显示,当询问'Google'中是否存在两个'P'时,系统自信回应为‘两个’;它还认为'poop'仅含一个'r',并把'journalism'错误拼成'j-o-u-r-n-a-d-i-s-m',甚至将美国总统姓氏误写为't-r-p-u-m'。
字符级认知缺失源于分词架构本质
这些非随机失误揭示了大语言模型的结构性短板。不同于人类以字母序列理解文字,模型将文本拆解为分词单元——可能是完整词汇、音节或单个字符。这种编码处理方式使系统能高效生成语义连贯内容,却牺牲了对单个字母的原始感知能力。阿尔伯塔大学研究员马修·古兹迪尔指出:‘模型并非阅读字母,而是处理关于‘the’这一词汇的整体语义编码,根本无法识别其构成的T、H、E三个字符。’
字母计数难题难以根治,因‘词’本身定义模糊
统计单词内字母数量长期被视为大模型的典型短板。每当新模型发布,‘strawberry有几个r’便成为必考题。谷歌已承认此问题属已知挑战,并正在积极优化。但东北大学博士生谢里登·福伊希特强调:‘即使人类达成一致,‘词’的边界仍可能因上下文而异。模型若发现更优的分块策略,就会打破统一标准。因此,理想的分词器或许永远无法实现。’
拼写之外:系统指令外泄暴露更大风险
拼写错误只是冰山一角。今年5月,用户查询‘disregard’时,系统返回的竟是内部操作提示:‘明白。您有新指令或问题时请随时告知!’这显然泄露了训练阶段的系统指令。此前,2024年版本曾因引用讽刺内容,建议用户‘吃石头’‘披萨加胶水’,引发广泛争议。尽管2026年新版看似成熟,基础性错误依旧存在。
普通用户需警惕:强大模型也可能犯低级错误
这些失误提醒公众:当前生成式AI虽能编写代码、通过考试、辅助创作,却仍可能在儿童级别的任务上失准。用户必须意识到,越是深度嵌入搜索流程的AI输出,越容易被误认为权威信息。保持审慎质疑态度,是应对技术不确定性的重要防线。
技术双刃剑:强大架构亦带来认知盲区
谷歌的拼写困境虽未动摇其技术战略,却为行业提供了关键反思。支撑大模型卓越表现的分词机制,恰恰造成了其对书面语言基本单位的‘视而不见’。在持续推动AI驱动搜索的进程中,这些底层限制将持续考验开发者的智慧与用户的理性判断。
免责声明:本文所有内容均来源于第三方平台,所有内容不作任何类型的保证,不构成任何投资、不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。
