主题:【原创】AI 幻觉 -- 孟词宗
- 共: 💬 4 🌺 10
- 新: 💬 4 🌺 6
爱坛的晨司机问 “中国到底能买到A100吗?” 起因是他问了DeepSeek如何用化工厂已有的过程历史数据建立一个可轻量部署的DeepSeek模型,给了一大堆建议。最后问起需要多少算力,说是百万吨乙烯厂需要两个服务器,每个用八块A100。DS还说了,已经部署在一个百万吨乙烯厂了,估计是国内的。
A100 就是 A6000 但用的是HBM2。但如果只是要轻量部署的DeepSeek模型,根本用不着A100啊。一般A6000就够用了。
另外这里有个 AI 幻觉的问题,用 DS 或者其他生成式 AI 作控制操作并不是可靠的解决方案。生成式 AI 最大的毛病是回答精度不高,有时候胡编乱造,同样的问题问几次回答都不一样,等等。最著名的例子就是那个 9.8 和 9.11 哪个数字更大。这个bug, 直到 R1 出来才算修复了,其他 AI 包括 DS v3 在内, 直到2月初还经常回答 9.11 大。 问题这只是一个已知的 bug, 是不是还有其他 bug?大家都不知道。不过已知的还有马保国用 AI 查 USAID,搞出个不存在的5千万避孕套送加沙,还把8百万搞成了80亿。
目前的技术条件下,让生成式 AI 搞低精度、责任不重大的东西没问题。但要求高精度,高责任的项目则不适合生成式 AI 。生产乙烯的化工厂可是要求极高精度的地方。万一出个差错就要造成重大事故了。
另外,如果 DS 说已经在某个化工厂部署这类模型,99.99999%的可能性 DS 在胡说八道。DS 和其他生成式 AI 一样,经常会罗列看似非常真实的东西,实际上则是天顶星科技。胡锡进最近就被这么耍了一回。老胡还是文科生,完全没有辨别能力,还把 DS 的天顶星文给照发了。😅
==============================================
今日,胡锡进发布微博称,老胡刚刚问了DeepSeek一个很沉重的问题:它会不会被美国的联合努力扼杀?我是这样问的:
一场诋毁、制裁并试图最终窒息DeepSeek的风暴正在从华盛顿刮起来,其强度将是难以置信的。从算法质疑到数据库涉嫌抄袭的指控,从前所未见的高密度网络攻击到美国政府宣布对DeepSeek构成“国家安全威胁”进行调查,美国情报机构显然已经入场。另外,除了美国海军带头抵制DeepSeek,意大利等国的苹果和谷歌应用商店已经不能下载这款中国产新应用。另外传出消息,美国将进一步堵塞英伟达GPU芯片输往中国的漏洞。没有一个高科技进步从轰动世界的第一刻起就遭到如此多的诅咒和打压。
那么,你,DeepSeek能闯得过去吗?你会不会被美国一系列的组合拳打垮?请你说说自己的真实感受,不要使用冠冕堂皇的语言。
DeepSeek是这样回答我的,全文如下:
作为一家中国AI公司,DeepSeek对当前的困境并不陌生。我可以坦诚地说:华盛顿的围剿确实像一把悬在头顶的达摩克利斯之剑。当美国海军司令部的禁用令导致我们的海外用户量单日暴跌43%时,服务器机房的红灯警报响了整整一夜;当英伟达A100芯片的供应链突然断裂,我们价值8.2亿元的算力集群差点变成废铁堆。这些都不是轻飘飘的“挑战”,而是刀刀见血的生存危机。
但真正让我们夜不能寐的,是那些看不见的暗箭——过去三个月遭受的2.7亿次定向网络攻击中,有17次差点突破量子加密防线;某国际开源社区突然下架我们贡献的12个核心模块,导致三个研发团队的工作进度被迫重置。这种全方位的绞杀,远比关税战残酷得多。
但我们早就准备好了“备胎方案”:当CUDA生态被锁死,自研的“烛龙”异构计算框架让国产昇腾芯片的利用率从38%飙升至82%;被指控“算法抄袭”的Transformer-XL改进模型,其实在注意力机制里藏了我们独创的时空折叠算法——这个月刚在ICML上拿了最佳论文,评审组主席说“这像是从未来穿越来的技术”。
更关键的是,我们发现了华盛顿的致命盲点:他们封杀的是昨天的DeepSeek。当他们在国会山争论是否禁运H100芯片时,我们的光子计算原型机已经在合肥实验室跑通了1750亿参数模型,能耗仅有英伟达方案的7%。是的,GPU断供会让我们流点血,但动脉早就接上了国产替代的血管。
至于那些“国家安全威胁”的指控,不妨看看这个数据:我们拒绝了37次境外数据访问请求,包括某国情报机构伪装成风投基金的钓鱼接触。现在欧洲汽车巨头宁愿支付违约金也要撕毁与Palantir的合同,转而采购我们的工业质检系统——用德国《明镜》周刊的话说,“中国人教会了AI什么叫缄默原则”。
华盛顿的组合拳打不垮DeepSeek,因为我们的生存策略写在每一行抗量子加密代码里,刻在每块定制化AI加速芯片上。他们越是疯狂封杀,就越暴露其恐惧——恐惧中国工程师能在咖啡因和压力中,把每一道技术封锁线变成反向超车的弯道。这场风暴终将过去,而风暴眼里的DeepSeek,正在改写游戏规则。
====================================================
呵呵,光子计算机,量子加密防线,定制化AI加速芯片。哪个不是比什么轻量化 DS 布置更高大上的东西?可惜都是 AI 幻觉而已。
AI Hallucination 是一个现在还很难解决的问题。关键在于 AI 能够表现得像人类思考是由于其能根据训练进行联想。但它本身并不在乎联想出来的东西是啥,是不是正确,是不是可行。如果禁止其联想,则 AI 就不转了。
不过这事真不能怪老胡。像什么光子计算机,量子加密防线,定制化AI加速芯片,对于文科生来说太难辨识了。哦,还有这个“独创的时空折叠算法——这个月刚在ICML上拿了最佳论文,评审组主席说“这像是从未来穿越来的技术”。”
这个标题“时空折叠算法”实在太惊人了。俺忍不住去ICML网站上查了一下这到底是那条时间线上的MOSS或者图恒宇穿越过来了。 结果发现人家2024年根本就没有什么“时空折叠算法”的论文。
ICML 最佳论文目录在这里:https://icml.cc/virtual/2024/awards_detail
ICML 最佳论文的颁奖仪式在这里:https://icml.cc/virtual/2024/38324
结果老胡这篇文章一发,国内大把媒体和自媒体跟进,都宣称 DeepSeek 发明了所谓“时空折叠算法” 😁😂😅