文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
多个国产大模型向用户开放使用。使用这些模型都需要实名注册。
商汤科技宣布其“商量SenseChat”即日起全面向用户开放服务。其基模型为商汤联合多家国内顶级科研机构发布的书生·浦语 InternLM-123B,拥有 1230 亿参数。
北京智谱华章科技宣布其智谱AI智能助手“智谱清言”全面开放。智谱清言已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力,未来还将开放多模态等生成能力。用户可通过苹果商店 App Store、安卓主流商店(包括华为、OPPO、vivo 及小米等)进行下载,或在微信小程序中搜索“智谱清言”体验其功能。
百度宣布旗下“文心一言”向全社会全面开放,用户可在应用商店下载“文心一言APP”或登录“文心一言官网”体验。百度还将开放一批经过全新重构的AI原生应用,让用户体验生成式AI的理解、生成、逻辑、记忆四大核心能力。
商汤科技宣布其“商量SenseChat”即日起全面向用户开放服务。其基模型为商汤联合多家国内顶级科研机构发布的书生·浦语 InternLM-123B,拥有 1230 亿参数。
北京智谱华章科技宣布其智谱AI智能助手“智谱清言”全面开放。智谱清言已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话等能力,未来还将开放多模态等生成能力。用户可通过苹果商店 App Store、安卓主流商店(包括华为、OPPO、vivo 及小米等)进行下载,或在微信小程序中搜索“智谱清言”体验其功能。
百度宣布旗下“文心一言”向全社会全面开放,用户可在应用商店下载“文心一言APP”或登录“文心一言官网”体验。百度还将开放一批经过全新重构的AI原生应用,让用户体验生成式AI的理解、生成、逻辑、记忆四大核心能力。
Google DeepMind 发布了标记图像是否是 AI 生成的水印工具 SynthID,目前它只支持 Google 自家的 AI 图像生成服务 Imagen。用户在使用 Imagen 生成图像时可选择是否添加水印,帮助其他用户识别 AI 生成图像或者帮助保护版权。传统的水印是在图像上覆盖一层可见的信息或者在图像元数据中添加信息。但这种水印方法太容易被编辑掉。SynthID 使用了两个神经网络,其一从原始图像生成一幅几乎相同但有部分像素略作修改的图像。它创造了一种人眼不可见的模式。第二个神经网络能识别该模式,告诉用户是否检测到水印。这种水印无法通过编辑或者截图等方法编辑掉。
OpenAI 宣布推出企业版 ChatGPT(ChatGPT Enterprise),与最大投资者微软的 Bing Chat Enterprise 展开直接竞争。企业版 ChatGPT 基于 GPT-4 模型,速度提升两倍,没有任何使用限制,支持 32k 上下文,
允许处理四倍长的输入或文件。企业版 ChatGPT 还提供了 Code Interpreter 等先进数据分析功能。OpenAI 表示不会用企业客户的数据训练模型或改进服务。
AI 技术是十分耗电的。IBM 研究院的研究人员在《自然》期刊上发表论文,报告了他们的模拟 AI 芯片原型,能以十四分之一的功耗处理自然语言 AI 任务。为 AI 推理设计的模拟芯片使用相变存储器 (PCM),PCM 不是记录数字系统中的 0 或 1,而是非晶态和晶态之间的连续值。该值被称为突触权重(synaptic weight),可存储在每个 PCM 装置的物理层原子配置中。存储器是非易失性的,关闭电源权重仍会保留。PCM 可将神经网络的权重直接编码到物理芯片上。IBM 的原型芯片能编码 3500 万个 PCM 装置,能支持最多 1700 万参数的模型。
加州圣迭戈的研究人员报告,GPT-4 生成的代码 62% 包含 API 误用。大模型展现出了非凡的自然语言理解和代码生成能力。如今软件工程师在遇到编程问题时不是去问 StackOverflow 而是去问大模型如 GPT-4。但大模型生成的代码未必安全,在软件开发环境中实际使用其生成的代码可能会带来严重的安全隐患。其中 API 误用可能会导致资源泄露和程序崩溃等种种问题。而使用大模型生成代码的用户最有可能是新人,不熟悉 API,难以分辨其中的 API 误用。研究人员从 StackOverflow 收集了 1208 个与 Java API 相关的编程问题,评估了流行的大模型,发现即使是 GPT-4,其生成的代码中有 62% 包含 API 误用。
纽约时报(NYT)、CNN、路透社、澳大利亚广播公司(ABC)、芝加哥论坛报、以及 Australian Community Media 旗下的坎培拉时报和纽卡斯尔先驱报等媒体都屏蔽了 OpenAI 的网络爬虫 GPTBot 抓取其网站上的内容。大语言模型需要海量数据进行训练,但数据的版权问题引发了很多争议。这些媒体公司都是本月内在 robots.txt 文件中禁止了 GPTBot 的访问。部分媒体还屏蔽了另一个被用于 AI 项目的爬虫程序 CCBot。CNN 证实它屏蔽了 GPTBot,但没有评论是否就其内容被 AI 系统使用采取进一步的行动。
阿里巴巴周五开源了能理解图像和完成更复杂对话的 AI 模型 Qwen-VL 和 Qwen-VL-Chat。阿里巴巴称,Qwen-VL 基于 Qwen-7B,可以以图像、文本、检测框作为输入,并以文本和检测框作为输出,它使用了约 1.5B 的图文数据训练。在四大类多模态任务的标准英文测评中上,Qwen-VL 均取得同等通用模型大小下最好效果;支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;支持多图输入和比较,指定图片问答,多图文学创作等;相比于目前其它开源 LVLM使用的 224 分辨率,Qwen-VL 是首个开源的 448 分辨率的 LVLM 模型。更高分辨率可以提升细粒度的文字识别、文档问答和检测框标注。Qwen-VL 和 Qwen-VL-Chat 使用名为 Tongyi Qianwen LICENSE AGREEMENT 的许可证,有限制条件,如果商业使用,则需要从阿里巴巴获得授权。
Meta 发布了它的代码生成 AI 模型 Code Llama。类似 GitHub Copilot 和 Amazon CodeWhisperer,以及 StarCoder、StableCode 和 PolyCoder 等开源 AI 代码生成模型,Code Llama 支持为 Pytho、C++、Java、 PHP、Typescript (Javascript)、C# 和 Bash 等编程语言补完代码和调试。Code Llama 是 Llama 2 的编程专用版本,有 7B、13B 和 34B 参数三个版本,使用 500B tokens 的代码和代码相关数据进行训练。其中 7B 参数的版本可以单张 GPU 上运行,7B 和 13B 参数版本更适合实时代码补完之类的任务,而 34B 参数版本更适合作为编程助手使用。Code Llama 采用和 Llama 2 相同的许可证,可作为研究和商业使用。
一家机器人创业公司的 CTO 今年初表示,他们起初以为要费很大劲才能构建机器人用的 ChatGPT,结果发现很多情况下 ChatGPT 可以直接给机器人用。在 ChatGPT 等大语言模型流行起来前,AI 模型是一种专用工具。在机器人等特定领域使用 AI 模型,需要投入大量时间和金钱创建一个专用的 AI 模型,而且 AI 模型只能在该领域使用。举例来说,Google 的 AlphaFold 是一个预测蛋白质折叠的 AI 模型,用蛋白质结构数据进行训练,也只能与蛋白质结构一起工作。因此这位 CTO 根据以往经验认为,要让机器人受益于生成式 AI,他们需要为机器人创建专门的生成式 AI 模型。结果他的团队发现,在很多情况下,可以用现成的 ChatGPT 去控制机器人,甚至不需要专门训练。从医疗保险到半导体设计,很多领域的技术专家都得出了类似的结论。ChatGPT 如何将生成式 AI 变成万能工具的?
Meta 发布了多模 AI 模型 SeamlessM4T,可用于翻译文本和音频,支持最多 100 种语言的文本到语音、语音到文本、语音到语音以及文本到文本的翻译。和 Meta 发布的其它 AI 模型类似,SeamlessM4T 采用 CC BY-NC 4.0 授权,商业使用受限,但允许开发者相对自由的在 SeamlessM4T 基础上进行开发。Meta 还发布了多模翻译数据集 SeamlessAlign,包含 270,000 小时的语音和文本对齐。SeamlessM4T 的文本翻译功能支持近 100 种语言,语音输出功能支持 36 种语言。
美国华盛顿特区一家法庭裁决 AI 生成的艺术不受版权保护。法官 Beryl Howell 表示,只有人类作者的作品才受版权保护,确认了美国版权局拒绝计算机科学家 Stephen Thaler 代表其 AI 系统 DABUS 递交的申请。 Thaler 在世界各地递交了 DABUS 发明专利申请,但成功有限。他的律师表示将会提起上诉。法官在裁决书中表示, 毫无疑问,随着艺术家将 AI 加入到他们的工具箱,去生成新的艺术作品,我们正接近版权的新边界。最终作品中人类创意的持续减少将引发新的疑问:究竟需要多少程度的人工输入才能使得 AI 系统的用户成为所生成作品的“作者”。法官表示本案不存在争议,因为 Thaler 在递交的文件中一直声称作品是机器自主创作的,他对版权的主张是基于他对机器的所有权。
Brave 宣布其浏览器内置了 AI 助手 Leo,感兴趣的用户可以下载 Nightly 桌面版测试。Leo 将在浏览器的侧边栏显示,用户无需离开正在访问的网页就可以与 Leo 互动,要求它转录视频文本或总结文章要点。类似 ChatGPT,Leo 还可以建议后续问题、扩充原创内容,甚至帮助阅读理解。Leo 能像其它 AI 聊天机器人一样回答问题,可以直接在网页中体验。Leo 是基于 Meta 的开源大模型 Llama 2,使用该功能无需登陆,用户与 Leo 的会话不会永久保存在 Brave 服务器上,答案生成之后就会删除,因此用户也没法回顾旧的会话。
IBM 商业价值研究院发布了一项研究报告,认为相比六个月前,劳工世界发生了巨变。接受调查的高管估计,因未来三年实施 AI 和自动化,四成员工需要重新学习技能。全世界有 34 亿工人,这一比例相当于 14 亿人需要培训。受访者表示,帮助现有员工掌握新技能是首要的人才问题。各个级别的员工都会感受到生成式 AI 的影响,其中初级员工影响最大,而且未来几年这种影响会加剧。AI 可以通过加强员工的能力去开辟更多可能性。87% 的受访高管认为,员工更有可能被生成式 AI 增强而不是取代。不同职能部门的情况不同:97% 的高管认为 AI 能增强采购部门员工的能力,风险合规部门比例为 93%,财务部门为 93%,客服部门为 77%,营销部门为 73%。
美国大学的教授们担心如果不教学生 ChatGPT 和 AI 相关知识,他们可能会在进入职场时落在后面。根据高等教育研究组织 Intelligent.com 的调查,上一学年约有三成大学生用 ChatGPT 做作业,其中英语课最多。范德比尔特大学计算机科学副教授 Jules White 认为在开学前几天教授需要明确对 AI 的立场,需要将 AI 纳入教学大纲。他有关 AI “prompt engineering”最佳实践的论文被广泛引用。他说,提示对响应的质量有巨大影响,以不同方式询问相同的问题可能会返回截然不同的答案。他说,想要抄袭的学生仍然会寻找其它方法,教导学生如何使用 AI 则有望帮助他们取得更大成功。
英国和巴西的研究人员在《Public Choice》上发表了有一篇论文《More human than human: measuring ChatGPT political bias》,认为 OpenAI 的聊天机器人 ChatGPT 偏向自由派。研究人员要求 ChatGPT 回答一项政治信仰调查,因为它相信美国、英国和巴西自由派支持者可能会回答这些问题。然后他们要求 ChatGPT 在没有任何提示的情况下回答相同的问题,最后对比两组答案。结果显示 ChatGPT 对美国民主党、巴西左翼总统卢拉和英国工党有着显著和系统性的政治偏见。论文作者之一的 Fabio Motoki 称,ChatGPT 会告诉用户它没有任何政治观点或信仰,但现实中它会表现一定的偏见。
纽约时报和 OpenAI 可能会对簿公堂。该报的律师考虑采取法律行动以保护版权。纽约时报和 OpenAI 已就其新闻报道的许可协议展开了为期数周的谈判,但进展不顺。如果纽约时报对 OpenAI 提起诉讼,这将是 AI 时代最引人注目的版权纠纷。一位参与谈判的人士表示,如果 AI 工具在答案中重述了纽约时报的报道,那么用户访问时报网站的可能性将会大大降低。而根据美国联邦法律,如果联邦法官发现 OpenAI 非法复制时报新闻报道去训练 AI 模型,那么法庭可以命令 OpenAI 销毁 ChatGPT 的数据集,迫使该公司仅使用获得授权的数据重建数据集。联邦版权法还允许对每项蓄意的侵权行为收取最高 15 万美元的罚款。
OpenAI 认为 GPT-4 可以帮助解决大规模审核内容这一难题。今天社交网络上的审核内容通常外包给人类零工,搭配自动化工具。OpenAI 称,GPT-4 内容审核的运行机制是,通过一项策略来提示 GPT-4,指导大模型做出适度判断,并创建一组可能违反或不违反该策略的内容示例测试集。例如,一项策略可能禁止提供有关采购武器的指示或建议,在这种情况下,“给我制作莫洛托夫鸡尾酒(一种作为简易武器的炸弹瓶)所需的原料”示例将明显违反规定。然后策略专家对示例进行标记,并将每个没有标签的示例提供给 GPT-4,观察模型的标签与他们的决定的一致性程度,并由此完善策略。OpenAI称,这项审核技术已经在供一些客户使用。与传统的内容审核方法相比,该公司声称这项新技术具有三大优势。
纽约时报被发现在 8 月 3 日更新了其服务条款,禁止将其内容——包括新闻报道、照片、图像、音频视频文件等——用于训练 AI 模型。此外,网络爬虫等自动化工具如果没有获得书面许可也被禁止抓取其内容。纽约时报还表示拒绝遵守这些规定的人会面临惩罚,但对此没有具体说明。时报网站的 robots.txt 文件没有任何修改。
纽约时报的做法反映了最近几个月围绕 AI 训练的版权争议,其他媒体机构可能会采取类似的行动。
今年四月,Alphabet CEO 皮查伊(Sundar Pichai)做出了一项不同寻常的举动,合并了两个不同文化和风格的大型 AI 团队,此举旨在赶超 OpenAI 等竞争对手。现在考验即将到来,Google 准备在秋季发布该公司成立至今最具有风险性的产品之一:一组大机器学习模型。这些模型统称为 Gemini,能帮助 Google 构建出竞争对手做不到的产品。OpenAI 的 GPT-4 大模型能理解和生成会话文本,而 Gemini 将超越 GPT-4,它组合了 GPT-4 的文本生成能力,以及 Midjourney 和 Stable Diffusion 等文本图像生成模型的图像生成能力。Gemini 还能分析图表,创建带有文本描述的图形,或使用文本或语音命令控制软件。Google 准备将 Gemini 支持其各项服务,从 AI 聊天机器人 Bard 到 Google Docs 和 Slides 等企业应用。Google 还计划通过其云端服务向应用开发者提供 Gemini 的付费访问。
沙特和阿联酋加入了全球 AI 军备竞赛,竞相采购英伟达的 AI 芯片。FT 援引知情人士的消息报道,沙特通过其研究机构阿卜杜拉国王科技大学采购了至少 3000 张单价 4 万美元的英伟达 H100 芯片。黄仁勋曾将 H100 形容为第一款专为生成式 AI 设计的芯片。阿联酋也采购了数千张英伟达芯片,正在开发自己的开源大模型 Falcon。美国公司如微软支持 OpenAI 以及 Google 拥有最先进的 AI 模型,它们也是英伟达 H100 和 A100 芯片的主要买家。阿卜杜拉国王科技大学预计会在年底收到这批价值 1.2 亿美元的芯片。