文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
- 为了逃避一年多兵役要坐一年牢 (1 points, 一般) by Craynic 在 2024年11月27日19时34分 星期三 评论到 韩国法院判处一名故意增肥以逃避兵役的男子缓刑
- 是否改进质量我不知道 (1 points, 一般) by Craynic 在 2024年11月25日20时43分 星期一 评论到 GitHub 称 Copilot 改进了代码质量
- Linus (1 points, 一般) by Craynic 在 2024年11月25日20时41分 星期一 评论到 Linux 6.13 将拒绝所有来自 bcachefs 作者的合并请求
- 2100年100% (1 points, 一般) by 18611782246 在 2024年11月21日16时30分 星期四 评论到 中国提高了半导体自给率
Google 上周向付费用户提供了其最新最先进的模型 Gemini 2.5,本周它开始向免费用户(有地区限制)提供了 Gemini 2.5 Pro (Experimental)。当然免费用户的使用是受到限制的,可能输入几次提示词就达到了限额。Gemini 2.5 支持模拟推理,能避免大模型常见的错误,目前它在 LMSYS Chatbot 排行榜中位居第一,排名第二的是 OpenAI 的 ChatGPT-4o-latest (2025-03-26),之后是 Grok-3-Preview-02-24、GPT-4.5-Preview、Gemini-2.0-Flash-Thinking-Exp-01-21、Gemini-2.0-Pro-Exp-02-05、DeepSeek-V3-0324 和 DeepSeek-R1。
1 月 19 日,旧金山发生了首起涉及完全自主驾驶汽车的致命车祸。涉及的无人驾驶汽车来自 Waymo,但车祸不是 Waymo 的错。是人类司机高速追尾导致六车连环相撞,造成一人死亡五人受伤,一条狗也在事故中死亡。这是典型的 Waymo 车祸。绝大多数车祸中它都严格遵守交通规则,但人类司机却违反规则、超速、闯红灯、偏离车道诸如此类。自 2020 年以来,Waymo 报告了约 60 起严重到触发安全气囊或造成伤害的事故,而 Waymo 的行驶里程至今超过了 5000 万英里。根据 Waymo 的估计,如果是人类司机,那么相似的里程人类的车祸频率要高得多严重得多。
在 AI 热下,Xiao Li 在 2023 年从一名房地产承包商跨行转为数据中心项目经理。一年前,他从微信群里看到大量英伟达 GPU 的芯片交易。交易商吹嘘能通过走私搞到被限制出口的英伟达 GPU。当时一块英伟达 H100 能卖出 20 万元。如今他的微信群里开始讲述不同的故事。AI 芯片的交易更谨慎,价格也回落了。两个数据中心项目因难以从投资者手中获得更多资金而被迫抛售 GPU。根据实地采访,很多运营 AI 数据中心的企业正陷入困境。36 氪等媒体报道,新建计算资源中高达八成未被使用。向 AI 公司出租英伟达 GPU 去训练大模型本被视为是一笔包赚的生意。然而随着 DeepSeek 的崛起以及 AI 周边经济形势的突变,该行业处于衰退之中。因为缺乏经验以及过度炒作,数据中心变成了不良资产。市场研究公司 KZ Consulting 称,2023 年和 2024 年,从内蒙古到广东,各地宣布了 500 多个新数据中心项目。中国通信工业协会数据中心委员会称,到 2024 年底,至少有 150 个新建数据中心建成并投入运营。国有企业、上市公司和国有基金纷纷投资建造 AI 数据中心。在 2024 年初有超过 144 家公司在网信办注册开发大模型,但到了年底只剩下 10% 的公司还在继续投资。DeepSeek 的 R1 和 OpenAI 的 ChatGPT o1 和 o3 等推理模型的兴起改变了企业对数据中心的需求。推理性能对延迟有高要求,意味着数据中心需要建造在相关 AI 企业附近,这意味着很多建造在中西部和农村地区的数据中心对 AI 公司没有什么吸引力。此外大多数数据中心是为训练大模型而不是推理优化的。推理使用的硬件也与训练使用的硬件有很多不同。在此背景下,GPU 租赁价格降至历史最低水平。一台配置了 8 个 GPU 的英伟达 H100 服务器的月租金从 18 万元的高位降至 7.5 万元。由于高昂的电费和维护费用,一些数据中心宁愿空置。
哥伦比亚大学对开发 AI 工具帮助面试者在编程问题中作弊的学生 Chungin“Roy”Lee 做出了停学的处罚。Lee 开发了 AI 工具 Interview Coder,帮助求职者在面试中完成编程相关的问题。该工具的月费为 60 美元。去年 12 月 Lee 发布了一则在亚马逊面试中使用 Interview Coder 的视频,之后被举报到学校,被纳入学校的纪律处分程序,出席了学校的听证会。在第一次听证会后,学校对他做出了留校察看的处罚。现在处罚加重。Lee 认为该工具能为他每年赚取约 200 万美元的收入。被停学后他准备直接去旧金山。
OpenAI ChatGPT 的新功能催生出一场吉卜力工作室动画风格图像的生成热潮。OpenAI CEO 奥尔特曼也将 X 平台(原推特)头像换成了吉卜力风格的图像,上传至社交平台(SNS)的此类生成图像层出不穷,但也有人担心这会引发著作权问题。部分美国媒体指出,新功能使得“复制著作权受保护作品的风格变得更加容易”。报道同时指出,知识产权专家认为在法律上这属于“灰色地带”,可能会引发著作权纠纷。
AI 创业公司零一万物 CEO 李开复表示,在 AI 的部分领域中美之间的差距仅为三个月。他说,“以前我认为差距是六到九个月,而且是全方面落后。现在我认为,在部分核心技术上可能落后三个月,在某些特定领域实际上处于领先位置。”李开复称 DeepSeek 的成功表明中国在基础设施软件工程等领域领先。李开复还认为,美国限制向中国出口先进 AI 芯片是一把双刃剑,促使中国公司进行创新。
AI 技术对电力的狂热需求可以上溯到 2012 年的 AlexNet。当时多伦多大学的 AI 研究员 Alex Krizhevsky、 Ilya Sutskever 和 Geoffrey E. Hinton 正在为图像识别竞赛 ImageNet LSRVC 开发一种卷积神经网络。在当时图像识别是非常有挑战性的。研究人员认为他们需要一个庞大的神经网络,该网络以首席研究员的名字命名为 AlexNet,它有超过 6000 万参数和 65 万个神经元。但一大问题是如此大的神经网络如何进行训练?他们的实验室里有几张英伟达 GTX 580 显卡,每张配备了 3GB 显存,但 AlexNet 太大没办法加载到单张显卡上。研究人员设法将训练阶段划分到两张并行工作的 GPU 上——一半神经元在一张 GPU 上,另一半在另一张上运行。AlexNet 以压倒性优势赢得了 2012 年的比赛,从此 AI 模型的规模不再受限于单张显卡了,而妖精也从瓶子里释放了出来。在 AlexNet 之后,越来越强大的 AI 模型需要成千上万张 GPU。根据 Electric Power Research Institute (EPRI)的报告,2010 年到 2020 年间数据中心的功耗相对平稳,原因是英伟达数据中心 GPU 的功耗同期提升了大约 15 倍,因此能保持数据中心功耗的稳定。到了 2022 年基于 transformer 的大模型的出现推动了数据中心功耗的大幅提升。大模型需要处理数百亿甚至数千亿个神经元,训练之后的推理阶段还需要处理大量数据。Open AI 在训练新模型时使用了超过 25,000 张英伟达 Ampere 100 GPU,持续了 100 天,耗电量 50 GW 时,足以满足一个中型城镇一年的电力需求。根据 Google 的数据,训练占 AI 模型生命周期总耗电量的四成,剩下的六成是推理。功耗的飙升促使科学家思考如何在不牺牲性能的情况下减少内存和计算要求。研究人员尝试了模型剪枝、量化等优化方法。
Google 和计算机历史博物馆联合公布了 AlexNet 的源代码,代码发布在博物馆的 GitHub 账户上,采用 BSD 2-Clause "Simplified" 许可证。AlexNet 是一种卷积神经网络 (CNN),它在 2012 年发布时被认为改变了 AI 领域,代表着深度学习能做到传统 AI 技术无法做到的事情,在 AI 发展中具有里程碑意义。AlexNet 能以接近人类的正确率准确识别照片中的物体。它源自多伦多大学研究生 Alex Krizhevsky、Ilya Sutskever 及其导师 Geoffrey Hinton 的工作,证明深度学习能胜过传统的计算机视觉方法。Google 在 2013 年收购了研究团队创办的 DNNresearch 公司,从而拥有了其知识产权。
Pillar Security 研究人员报告,通过分发恶意规则配置文件,GitHub Copilot 和 Cursor 等 AI 编程助手能被操纵生成包含后门、漏洞和其它安全问题的代码。AI 编程智能体(AI agent)使用规则文件指导在生成或编辑代码时的行为。例如规则文件可能包含指示助手遵循某些编程最佳实践、使用特定格式或以特定语言输出响应的指令。Pillar 研究人员的攻击技术被称为“规则文件后门(Rules File Backdoor)”,通过向规则文件注入人类用户不可见但 AI 智能体可读的指令,武器化规则文件。一旦将含毒的规则文件导入 GitHub Copilot 或 Cursor,AI 智能体在帮助受害者编程的同时阅读并遵循攻击者的指令。
在 PC 上本地运行大模型日益流行,AMD 也推出了自己的在本地运行大模型项目 Gaia。源代码托管在 GitHub 上,采用 MIT 许可证。Gaia 目前只支持 Windows 11 Pro/Home,不支持 macOS 或 Linux。Gaia 提供了两个安装程序,一个适用于任何 Windows PC 的 Generic Mode,基于 Ollama 后端;另一个为 AMD 的 Ryzen AI 处理器进行优化的 Hybrid Mode,能利用其 NPU 和 iGPU 执行计算,以获得更好的性能。AMD 从 Zen4 APU 开始整合 NPU,但此前很少有程序能直接利用 NPU。
英伟达一年一度的开发者大会 GTC 于 3 月 21 日闭幕,这次会议凸显了中美 AI 加速分裂。在 GTC 会场上,阿里巴巴和腾讯展示了 AI 研究成果。在线上,包括百度在内的多家中国企业,以及英伟达的华人员工,还专门举行了一场全程仅用中文交流的讨论会。英伟达 CEO 黄仁勋被问及中美对立的影响时回答:“据我观察,全球 AI 研究人员中有一半来自中国。在所有美国的 AI 研究所中,优秀的中国研究人员数量众多,绝无例外”。对于英伟达来说,如果分裂进一步加剧,其收益对美国的“依赖”可能会增强。自美国政府加强管制以来,中国市场销售额的占比一直在降低。从英伟达的中国销售额在总销售额中的占比来看,2024 财年(截至2025年1月)为总体的 13%,比 2021 财年减少了一半。
Google 上周发布的 Gemini 2.0 Flash(Image Generation) Experimental 新模型过去几天吸引了越来越多的关注,该模型通过 Google AI Studio 提供给用户使用。它允许任何人通过输入提示词去修改和编辑图像,让任何人都能像专业人士那样处理图像或者叫 PS。Gemini 2.0 Flash 可以添加对象、删除对象、修改场景、更改灯光、更改图像角度、放大或缩小等操作。它支持对话式图像编辑,允许用户通过自然语言对话在多个连续提示中迭代优化图像。
OpenAI 希望 AI 公司使用版权材料训练大模型的做法属于合理使用,而 Google 在此问题上与 OpenAI 意见一致。和 OpenAI 一样,Google 也因为使用版权材料训练 AI 而面临诉讼,而搜索巨人也希望 AI 公司能避免因未经授权使用版权材料训练 AI 而承担责任。Google 呼吁“平衡版权规定”,声称获取公开但通常受版权保护的数据对于改进生成式 AI 系统至关重要。Google 希望能使用公开可用的数据(免费或受版权保护)进行 AI 开发,而无需经历“不可预测、不平衡和漫长的谈判”。Google 声称,在 AI 中使用任何受版权保护的材料都不会对版权所有者产生重大影响。
网信办、公安部、工信部和广电总局等联合发布《人工智能生成合成内容标识办法》,该《办法》从 9 月 1 日开始实施,要求标识 AI 合成的内容。
第三条 人工智能生成合成内容是指利用人工智能技术生成、合成的文本、图片、音频、视频、虚拟场景等信息。
人工智能生成合成内容标识包括显式标识和隐式标识。
显式标识是指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可以被用户明显感知到的标识。
隐式标识是指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。
第四条 服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识:
(一)在文本的起始、末尾或者中间适当位置添加文字提示或者通用符号提示等标识,或者在交互场景界面、文字周边添加显著的提示标识;
(二)在音频的起始、末尾或者中间适当位置添加语音提示或者音频节奏提示等标识,或者在交互场景界面中添加显著的提示标识;
(三)在图片的适当位置添加显著的提示标识;
(四)在视频起始画面和视频播放周边的适当位置添加显著的提示标识,可以在视频末尾和中间适当位置添加显著的提示标识;
(五)呈现虚拟场景时,在起始画面的适当位置添加显著的提示标识,可以在虚拟场景持续服务过程中的适当位置添加显著的提示标识;
(六)其他生成合成服务场景根据自身应用特点添加显著的提示标识。
服务提供者提供生成合成内容下载、复制、导出等功能时,应当确保文件中含有满足要求的显式标识。
第十条 用户使用网络信息内容传播服务发布生成合成内容的,应当主动声明并使用服务提供者提供的标识功能进行标识。
任何组织和个人不得恶意删除、篡改、伪造、隐匿本办法规定的生成合成内容标识,不得为他人实施上述恶意行为提供工具或者服务,不得通过不正当标识手段损害他人合法权益。
人工智能生成合成内容标识包括显式标识和隐式标识。
显式标识是指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可以被用户明显感知到的标识。
隐式标识是指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。
第四条 服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识:
(一)在文本的起始、末尾或者中间适当位置添加文字提示或者通用符号提示等标识,或者在交互场景界面、文字周边添加显著的提示标识;
(二)在音频的起始、末尾或者中间适当位置添加语音提示或者音频节奏提示等标识,或者在交互场景界面中添加显著的提示标识;
(三)在图片的适当位置添加显著的提示标识;
(四)在视频起始画面和视频播放周边的适当位置添加显著的提示标识,可以在视频末尾和中间适当位置添加显著的提示标识;
(五)呈现虚拟场景时,在起始画面的适当位置添加显著的提示标识,可以在虚拟场景持续服务过程中的适当位置添加显著的提示标识;
(六)其他生成合成服务场景根据自身应用特点添加显著的提示标识。
服务提供者提供生成合成内容下载、复制、导出等功能时,应当确保文件中含有满足要求的显式标识。
第十条 用户使用网络信息内容传播服务发布生成合成内容的,应当主动声明并使用服务提供者提供的标识功能进行标识。
任何组织和个人不得恶意删除、篡改、伪造、隐匿本办法规定的生成合成内容标识,不得为他人实施上述恶意行为提供工具或者服务,不得通过不正当标识手段损害他人合法权益。
Gemini 将在今年晚些时候取代 Google Assistant。Google Assistant 是 Google 在 2016 年推出的数字助手,虽然 Gemini 品牌诞生仅一年时间,但 Google 正快速在各平台普及 Gemini。在 Android 上发布 Gemini 应用时,Google 强迫任何安装它的人禁用 Assistant 切换到 Gemini。当 Assistant 在 2025 年晚些时候退役时,Google 将从应用商店移除该应用,并将用户引导到 Gemini。Google 表示,使用 Assistant 的 Google 汽车、手表、耳机等设备将会收到更新会过渡到 Gemini,更多细节将会在未来几个月公布。
Waymo 的无人出租车设计遵守交通规定,但经常违反停车规定。根据旧金山市交通局的记录,去年 Waymo 收到了 589 张违反停车规定的罚单。这些无人出租车因阻碍交通、违反街道清洁限制和在限制区域停车等行为被处以 65,065 美元的罚款。Waymo 一家公司的罚款占到了旧金山总罚款的 0.05%。违反停车规定如在付费停车位停留时间过长只可能造成不便,并不会造成破坏。但在行驶过程中阻碍交通则可能增加车祸的风险,因为这可能迫使其他司机突然刹车或变道。
DeepSeek 的推理模型 R1 和大模型 V3 是中国 AI 公司第一次在 AI 技术上与外国竞争对手处于同一水平,而且模型的费用也更低。DeepSeek 热潮推动了它在中国的迅速普及。有 20 多个中国汽车品牌宣布了嵌入 DeepSeek 模型的计划,主要用于改进现有的 AI 功能。吉利称在 DeepSeek 的帮助下其最新车型甚至能理解司机的模糊指令,比如司机说我累了,AI 会关闭车窗,倾斜车椅,调低亮度,设置闹钟,让司机小睡下。排名前五的智能手机制造商都在更新中加入了 DeepSeek。华为用 R1 模型升级了其 AI 助手小艺,Oppo、荣耀、Vivo、小米也都集成了 R1。家电巨头美的推出了一系列 DeepSeek 增强空调,能根据用户的口头指令如“有点冷”自动调节温度和湿度水平。有约 100 家医院宣布本地部署 DeepSeek。各地政府也在积极采用 DeepSeek。
OpenAI 希望特朗普政府于 7 月公布 AI Action Plan 时通过宣布使用版权材料训练 AI 属于合理使用去解决相关版权分歧,从而为 AI 公司不受限制获取训练数据铺平道路,OpenAI 声称这对于在 AI 竞赛中打败中国至关重要。包括 OpenAI 在内的众多 AI 公司都遭到起诉被控侵犯版权,法庭正在斟酌 AI 训练是否属于合理使用,而版权方主张基于创意作品训练的 AI 模型可能在市场上取代它们,削弱人类整体的创意产出。OpenAI 主张是:OpenAI 的模型经过训练不会复制作品提供给公众消费,相反模型会从作品中学习并提取模式、语言结构和上下文见解,这意味着 AI 模型训练符合版权和合理使用原则的核心目标,利用现有作品创造全新而不同的东西,不会损害现有作品的商业价值。
Google 发布了新的多模模型 Gemma 3,开放权重,允许负责任的商业用途,128K 个令牌上下文,支持超过 140 种语言,提供了 10 亿、40 亿、120 亿、270 亿参数规模的模型可供选项。Google 称,Gemma 3 的 Elo 得分相当于 DeepSeek AI R1 模型的 98%,分别为 1338 分和 1363 分。但 DeepSeek 需要 32 张英伟达 H100 GPU 才能达到这一分数,而 Gemma 3 只需要一张 H100 GPU。Google 宣称 Gemma 3 是能在单张 GPU 或 TPU 上运行的最强大模型。
Meta 开始测试第一款自研 AI 训练芯片,此举旨在减少对英伟达 AI 芯片的依赖。英伟达是最大的 AI 芯片供应商。Meta 在 2025 年的资本支出预计高达 650 亿美元,绝大部分是投向 AI 基础设施。Meta 的新训练芯片是一种专用加速器,只能处理特定于 AI 任务,但比 GPU 更节能。芯片由台积电代工。Meta 希望到 2026 年用自研 芯片训练 AI 系统。