文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
- 为了逃避一年多兵役要坐一年牢 (1 points, 一般) by Craynic 在 2024年11月27日19时34分 星期三 评论到 韩国法院判处一名故意增肥以逃避兵役的男子缓刑
- 是否改进质量我不知道 (1 points, 一般) by Craynic 在 2024年11月25日20时43分 星期一 评论到 GitHub 称 Copilot 改进了代码质量
- Linus (1 points, 一般) by Craynic 在 2024年11月25日20时41分 星期一 评论到 Linux 6.13 将拒绝所有来自 bcachefs 作者的合并请求
- 2100年100% (1 points, 一般) by 18611782246 在 2024年11月21日16时30分 星期四 评论到 中国提高了半导体自给率
OpenAI ChatGPT 的新功能催生出一场吉卜力工作室动画风格图像的生成热潮。OpenAI CEO 奥尔特曼也将 X 平台(原推特)头像换成了吉卜力风格的图像,上传至社交平台(SNS)的此类生成图像层出不穷,但也有人担心这会引发著作权问题。部分美国媒体指出,新功能使得“复制著作权受保护作品的风格变得更加容易”。报道同时指出,知识产权专家认为在法律上这属于“灰色地带”,可能会引发著作权纠纷。
AI 创业公司零一万物 CEO 李开复表示,在 AI 的部分领域中美之间的差距仅为三个月。他说,“以前我认为差距是六到九个月,而且是全方面落后。现在我认为,在部分核心技术上可能落后三个月,在某些特定领域实际上处于领先位置。”李开复称 DeepSeek 的成功表明中国在基础设施软件工程等领域领先。李开复还认为,美国限制向中国出口先进 AI 芯片是一把双刃剑,促使中国公司进行创新。
AI 技术对电力的狂热需求可以上溯到 2012 年的 AlexNet。当时多伦多大学的 AI 研究员 Alex Krizhevsky、 Ilya Sutskever 和 Geoffrey E. Hinton 正在为图像识别竞赛 ImageNet LSRVC 开发一种卷积神经网络。在当时图像识别是非常有挑战性的。研究人员认为他们需要一个庞大的神经网络,该网络以首席研究员的名字命名为 AlexNet,它有超过 6000 万参数和 65 万个神经元。但一大问题是如此大的神经网络如何进行训练?他们的实验室里有几张英伟达 GTX 580 显卡,每张配备了 3GB 显存,但 AlexNet 太大没办法加载到单张显卡上。研究人员设法将训练阶段划分到两张并行工作的 GPU 上——一半神经元在一张 GPU 上,另一半在另一张上运行。AlexNet 以压倒性优势赢得了 2012 年的比赛,从此 AI 模型的规模不再受限于单张显卡了,而妖精也从瓶子里释放了出来。在 AlexNet 之后,越来越强大的 AI 模型需要成千上万张 GPU。根据 Electric Power Research Institute (EPRI)的报告,2010 年到 2020 年间数据中心的功耗相对平稳,原因是英伟达数据中心 GPU 的功耗同期提升了大约 15 倍,因此能保持数据中心功耗的稳定。到了 2022 年基于 transformer 的大模型的出现推动了数据中心功耗的大幅提升。大模型需要处理数百亿甚至数千亿个神经元,训练之后的推理阶段还需要处理大量数据。Open AI 在训练新模型时使用了超过 25,000 张英伟达 Ampere 100 GPU,持续了 100 天,耗电量 50 GW 时,足以满足一个中型城镇一年的电力需求。根据 Google 的数据,训练占 AI 模型生命周期总耗电量的四成,剩下的六成是推理。功耗的飙升促使科学家思考如何在不牺牲性能的情况下减少内存和计算要求。研究人员尝试了模型剪枝、量化等优化方法。
Google 和计算机历史博物馆联合公布了 AlexNet 的源代码,代码发布在博物馆的 GitHub 账户上,采用 BSD 2-Clause "Simplified" 许可证。AlexNet 是一种卷积神经网络 (CNN),它在 2012 年发布时被认为改变了 AI 领域,代表着深度学习能做到传统 AI 技术无法做到的事情,在 AI 发展中具有里程碑意义。AlexNet 能以接近人类的正确率准确识别照片中的物体。它源自多伦多大学研究生 Alex Krizhevsky、Ilya Sutskever 及其导师 Geoffrey Hinton 的工作,证明深度学习能胜过传统的计算机视觉方法。Google 在 2013 年收购了研究团队创办的 DNNresearch 公司,从而拥有了其知识产权。
Pillar Security 研究人员报告,通过分发恶意规则配置文件,GitHub Copilot 和 Cursor 等 AI 编程助手能被操纵生成包含后门、漏洞和其它安全问题的代码。AI 编程智能体(AI agent)使用规则文件指导在生成或编辑代码时的行为。例如规则文件可能包含指示助手遵循某些编程最佳实践、使用特定格式或以特定语言输出响应的指令。Pillar 研究人员的攻击技术被称为“规则文件后门(Rules File Backdoor)”,通过向规则文件注入人类用户不可见但 AI 智能体可读的指令,武器化规则文件。一旦将含毒的规则文件导入 GitHub Copilot 或 Cursor,AI 智能体在帮助受害者编程的同时阅读并遵循攻击者的指令。
在 PC 上本地运行大模型日益流行,AMD 也推出了自己的在本地运行大模型项目 Gaia。源代码托管在 GitHub 上,采用 MIT 许可证。Gaia 目前只支持 Windows 11 Pro/Home,不支持 macOS 或 Linux。Gaia 提供了两个安装程序,一个适用于任何 Windows PC 的 Generic Mode,基于 Ollama 后端;另一个为 AMD 的 Ryzen AI 处理器进行优化的 Hybrid Mode,能利用其 NPU 和 iGPU 执行计算,以获得更好的性能。AMD 从 Zen4 APU 开始整合 NPU,但此前很少有程序能直接利用 NPU。
英伟达一年一度的开发者大会 GTC 于 3 月 21 日闭幕,这次会议凸显了中美 AI 加速分裂。在 GTC 会场上,阿里巴巴和腾讯展示了 AI 研究成果。在线上,包括百度在内的多家中国企业,以及英伟达的华人员工,还专门举行了一场全程仅用中文交流的讨论会。英伟达 CEO 黄仁勋被问及中美对立的影响时回答:“据我观察,全球 AI 研究人员中有一半来自中国。在所有美国的 AI 研究所中,优秀的中国研究人员数量众多,绝无例外”。对于英伟达来说,如果分裂进一步加剧,其收益对美国的“依赖”可能会增强。自美国政府加强管制以来,中国市场销售额的占比一直在降低。从英伟达的中国销售额在总销售额中的占比来看,2024 财年(截至2025年1月)为总体的 13%,比 2021 财年减少了一半。
Google 上周发布的 Gemini 2.0 Flash(Image Generation) Experimental 新模型过去几天吸引了越来越多的关注,该模型通过 Google AI Studio 提供给用户使用。它允许任何人通过输入提示词去修改和编辑图像,让任何人都能像专业人士那样处理图像或者叫 PS。Gemini 2.0 Flash 可以添加对象、删除对象、修改场景、更改灯光、更改图像角度、放大或缩小等操作。它支持对话式图像编辑,允许用户通过自然语言对话在多个连续提示中迭代优化图像。
OpenAI 希望 AI 公司使用版权材料训练大模型的做法属于合理使用,而 Google 在此问题上与 OpenAI 意见一致。和 OpenAI 一样,Google 也因为使用版权材料训练 AI 而面临诉讼,而搜索巨人也希望 AI 公司能避免因未经授权使用版权材料训练 AI 而承担责任。Google 呼吁“平衡版权规定”,声称获取公开但通常受版权保护的数据对于改进生成式 AI 系统至关重要。Google 希望能使用公开可用的数据(免费或受版权保护)进行 AI 开发,而无需经历“不可预测、不平衡和漫长的谈判”。Google 声称,在 AI 中使用任何受版权保护的材料都不会对版权所有者产生重大影响。
网信办、公安部、工信部和广电总局等联合发布《人工智能生成合成内容标识办法》,该《办法》从 9 月 1 日开始实施,要求标识 AI 合成的内容。
第三条 人工智能生成合成内容是指利用人工智能技术生成、合成的文本、图片、音频、视频、虚拟场景等信息。
人工智能生成合成内容标识包括显式标识和隐式标识。
显式标识是指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可以被用户明显感知到的标识。
隐式标识是指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。
第四条 服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识:
(一)在文本的起始、末尾或者中间适当位置添加文字提示或者通用符号提示等标识,或者在交互场景界面、文字周边添加显著的提示标识;
(二)在音频的起始、末尾或者中间适当位置添加语音提示或者音频节奏提示等标识,或者在交互场景界面中添加显著的提示标识;
(三)在图片的适当位置添加显著的提示标识;
(四)在视频起始画面和视频播放周边的适当位置添加显著的提示标识,可以在视频末尾和中间适当位置添加显著的提示标识;
(五)呈现虚拟场景时,在起始画面的适当位置添加显著的提示标识,可以在虚拟场景持续服务过程中的适当位置添加显著的提示标识;
(六)其他生成合成服务场景根据自身应用特点添加显著的提示标识。
服务提供者提供生成合成内容下载、复制、导出等功能时,应当确保文件中含有满足要求的显式标识。
第十条 用户使用网络信息内容传播服务发布生成合成内容的,应当主动声明并使用服务提供者提供的标识功能进行标识。
任何组织和个人不得恶意删除、篡改、伪造、隐匿本办法规定的生成合成内容标识,不得为他人实施上述恶意行为提供工具或者服务,不得通过不正当标识手段损害他人合法权益。
人工智能生成合成内容标识包括显式标识和隐式标识。
显式标识是指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可以被用户明显感知到的标识。
隐式标识是指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。
第四条 服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识:
(一)在文本的起始、末尾或者中间适当位置添加文字提示或者通用符号提示等标识,或者在交互场景界面、文字周边添加显著的提示标识;
(二)在音频的起始、末尾或者中间适当位置添加语音提示或者音频节奏提示等标识,或者在交互场景界面中添加显著的提示标识;
(三)在图片的适当位置添加显著的提示标识;
(四)在视频起始画面和视频播放周边的适当位置添加显著的提示标识,可以在视频末尾和中间适当位置添加显著的提示标识;
(五)呈现虚拟场景时,在起始画面的适当位置添加显著的提示标识,可以在虚拟场景持续服务过程中的适当位置添加显著的提示标识;
(六)其他生成合成服务场景根据自身应用特点添加显著的提示标识。
服务提供者提供生成合成内容下载、复制、导出等功能时,应当确保文件中含有满足要求的显式标识。
第十条 用户使用网络信息内容传播服务发布生成合成内容的,应当主动声明并使用服务提供者提供的标识功能进行标识。
任何组织和个人不得恶意删除、篡改、伪造、隐匿本办法规定的生成合成内容标识,不得为他人实施上述恶意行为提供工具或者服务,不得通过不正当标识手段损害他人合法权益。
Gemini 将在今年晚些时候取代 Google Assistant。Google Assistant 是 Google 在 2016 年推出的数字助手,虽然 Gemini 品牌诞生仅一年时间,但 Google 正快速在各平台普及 Gemini。在 Android 上发布 Gemini 应用时,Google 强迫任何安装它的人禁用 Assistant 切换到 Gemini。当 Assistant 在 2025 年晚些时候退役时,Google 将从应用商店移除该应用,并将用户引导到 Gemini。Google 表示,使用 Assistant 的 Google 汽车、手表、耳机等设备将会收到更新会过渡到 Gemini,更多细节将会在未来几个月公布。
Waymo 的无人出租车设计遵守交通规定,但经常违反停车规定。根据旧金山市交通局的记录,去年 Waymo 收到了 589 张违反停车规定的罚单。这些无人出租车因阻碍交通、违反街道清洁限制和在限制区域停车等行为被处以 65,065 美元的罚款。Waymo 一家公司的罚款占到了旧金山总罚款的 0.05%。违反停车规定如在付费停车位停留时间过长只可能造成不便,并不会造成破坏。但在行驶过程中阻碍交通则可能增加车祸的风险,因为这可能迫使其他司机突然刹车或变道。
DeepSeek 的推理模型 R1 和大模型 V3 是中国 AI 公司第一次在 AI 技术上与外国竞争对手处于同一水平,而且模型的费用也更低。DeepSeek 热潮推动了它在中国的迅速普及。有 20 多个中国汽车品牌宣布了嵌入 DeepSeek 模型的计划,主要用于改进现有的 AI 功能。吉利称在 DeepSeek 的帮助下其最新车型甚至能理解司机的模糊指令,比如司机说我累了,AI 会关闭车窗,倾斜车椅,调低亮度,设置闹钟,让司机小睡下。排名前五的智能手机制造商都在更新中加入了 DeepSeek。华为用 R1 模型升级了其 AI 助手小艺,Oppo、荣耀、Vivo、小米也都集成了 R1。家电巨头美的推出了一系列 DeepSeek 增强空调,能根据用户的口头指令如“有点冷”自动调节温度和湿度水平。有约 100 家医院宣布本地部署 DeepSeek。各地政府也在积极采用 DeepSeek。
OpenAI 希望特朗普政府于 7 月公布 AI Action Plan 时通过宣布使用版权材料训练 AI 属于合理使用去解决相关版权分歧,从而为 AI 公司不受限制获取训练数据铺平道路,OpenAI 声称这对于在 AI 竞赛中打败中国至关重要。包括 OpenAI 在内的众多 AI 公司都遭到起诉被控侵犯版权,法庭正在斟酌 AI 训练是否属于合理使用,而版权方主张基于创意作品训练的 AI 模型可能在市场上取代它们,削弱人类整体的创意产出。OpenAI 主张是:OpenAI 的模型经过训练不会复制作品提供给公众消费,相反模型会从作品中学习并提取模式、语言结构和上下文见解,这意味着 AI 模型训练符合版权和合理使用原则的核心目标,利用现有作品创造全新而不同的东西,不会损害现有作品的商业价值。
Google 发布了新的多模模型 Gemma 3,开放权重,允许负责任的商业用途,128K 个令牌上下文,支持超过 140 种语言,提供了 10 亿、40 亿、120 亿、270 亿参数规模的模型可供选项。Google 称,Gemma 3 的 Elo 得分相当于 DeepSeek AI R1 模型的 98%,分别为 1338 分和 1363 分。但 DeepSeek 需要 32 张英伟达 H100 GPU 才能达到这一分数,而 Gemma 3 只需要一张 H100 GPU。Google 宣称 Gemma 3 是能在单张 GPU 或 TPU 上运行的最强大模型。
Meta 开始测试第一款自研 AI 训练芯片,此举旨在减少对英伟达 AI 芯片的依赖。英伟达是最大的 AI 芯片供应商。Meta 在 2025 年的资本支出预计高达 650 亿美元,绝大部分是投向 AI 基础设施。Meta 的新训练芯片是一种专用加速器,只能处理特定于 AI 任务,但比 GPU 更节能。芯片由台积电代工。Meta 希望到 2026 年用自研 芯片训练 AI 系统。
西班牙政府批准了一项法案,对未能明确标记 AI 生成内容的公司处以最高 3500 万欧元或其全球营业额 7% 的巨额罚款。西班牙数字化转型部长 Oscar Lopez 表示,法案采用了欧盟 AI Act 法的指导方针,对高风险 AI 系统施加严格的透明度义务。他说,AI 是一种强大的工具,能用于改善生活,但也能用于传播虚假信息和攻击民主。他指出每个人都容易受到“深度伪造”的攻击。法案还禁止利用难以察觉的声音和图像去操纵弱势群体,比如 AI 聊天机器人煽动成瘾者去赌博或者鼓励儿童做有危险性的挑战。法案还禁止使用 AI 通过生物特征数据对人进行分类评价以发放福利或评估犯罪风险。
Hugging Face 联合创始人兼首席科学家 Thomas Wolf 表示,AI 长于遵循指令,但并没有突破知识的界限。他分析了 AI 的局限性,AI 领域制造出的是“过度顺从的助手”而不是革命者。AI 目前并没有创造新知识,它只是在现有事实之间填补空白——他称之为“流形填充(manifold filling)”。他认为,AI 要真正推动科学突破,需要不能限于检索和综合信息。AI 应该能质疑自己的训练数据,采用反直觉的方法,从最少的输入中产生新的创意,提出意想不到的问题开辟新的研究路径。对于 AI 科技公司高管预言 AI 将加速科学进步,在 5 到 10 年内获得原本需要百年才可能完成的发现。Wolf 认为如果不改变研究方法这是不可能做到的。
微软据报道正在开发与 OpenAI 和 Anthropic 模型进行竞争的大模型 MAI。MAI 可能代表 Microsoft artificial intelligence,或者可能指的是微软内部开发的 AI 芯片 Maia 100。Maia 100 使用台积电 5 纳米工艺制造,有 1050 亿个晶体管,用于加速 AI 计算任务,以避免依赖单一供应商英伟达供应 AI 芯片。微软内部对 MAI 测试表明,它能与 OpenAI 和 Anthropic 的模型进行竞争。微软工程师正在评估将 MAI 集成到该公司的 AI 助手 Copilot 中,暗示 MAI 可能是通用模型而不是推理模型。微软据报道正在开发为推理任务优化的大模型系列。
OpenAI 目前将其用户账户分成三个级别:免费、20 美元月费的 Plus 和 200 美元的 Pro。OpenAI 据报道准备为其不同能力水平的智能体(AI Agent)推出一种分级定价结构:月费 2000 美元的智能体,针对高收入知识工作者;月费 1 万美元的软件开发智能体;月费 2 万美元的博士水平研究智能体。OpenAI 目前的年收入大约为 40 亿美元,该公司向投资者表示其智能体产品未来可能占到收入的 20-25%。