文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
日本的一项调查发现,三成日本大学生回答经常用 ChatGPT 等生成式 AI 工具,46.7% 的学生回答“曾经使用过”。对于 ChatGPT 等工具的用途,学生们表示最常用的是“论文与报告写作参考”,其次是“翻译和外语作文”,“咨询和聊天对象”。这次调查是在去年 10-11 月在网上进行的,来自 30 所大学的约 1 万名本科生做出了答复。
AI 创业公司 Anthropic 宣布了它的最新一代的模型 Claude 3,按性能从低到高分为 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,其中 Sonnet 和 Opus 已可在 claude.ai 上使用,Haiku 则需要等待一些时间。Anthropic 称它最先进的模型 Claude 3 Opus 在基准测试中超过了 OpenAI 的 GPT 4 和 Google 的 Gemini Ultra,称在复杂任务上达到了接近人类的理解能力和流畅性,引领通用智能的前沿。Opus 专为需要高级推理的复杂任务设计;Sonnet 是中档模型,为企业提供更具有成本效益的日常数据分析和知识工作解决方案;Haiku 设计更快且更经济,适用于面向消费者的 AI 聊天机器人等应用。
印度政府改变了它对 AI 模型不干涉的立场,发出意见书要求科技公司发布新模型前先获得政府批准。它还要求科技公司确保其服务或产品“不允许任何偏见或歧视,或危及选举过程的完整性”。印度电子信息技术部是在上周五向企业发布了这一意见书的,虽然目前它不具有法律约束力,但副部长 Rajeev Chandrasekhar 表示这代表着监管的未来。他在周一表示该意见针对的是在印度互联网上部署未经测试的 AI 平台,不针对创业公司。印度创业公司和风险投资公司则表示对政府发布的监管意见感到震惊,认为会阻碍印度公司的竞争力,而印度已经在全球竞争中落后了。
马斯克(Elon Musk)在旧金山高等法院起诉 OpenAI 及其首席执行官奥尔特曼(Sam Altman)等人,称其为了利润而非“人类的利益”开发人工智能,并要求该公司共享技术。诉讼文件称,奥尔特曼和 OpenAI 联合创始人格雷格·布罗克曼 2015 年与马斯克接洽,并同意成立一个非营利实验室,为“人类的利益”开发通用人工智能。实验室将开放其技术,这意味着共享其底层软件代码。起诉书称,这家公司创建了一个营利性业务部门,并限制他人对其技术的使用。在新董事会的领导下,该公司正在开发和完善通用人工智能,以最大限度地提高微软的利润,其出发点不是“人类的利益”。OpenAI 已转变为微软事实上的一个闭源子公司。马斯克指控 OpenAI 和奥尔特曼违反合同以及信托义务,并存在不公平的商业行为。布罗克曼也被列为被告。马斯克要求 OpenAI 开放其技术,并要求奥尔特曼等人偿还他提供的资金。
欧盟正在调查微软对法国 AI 创业公司 Mistral 的 1500 万欧元投资。Mistral 由 Google DeepMind 和 Meta 研究员于 2023 年创立,已从 Andreessen Horowitz 和 Lightspeed 等风投筹集到逾 3.85 亿欧元,其估值约为 18 亿欧元。本周一,Mistral 宣布了其最新的大模型 Mistral Large,宣布与微软合作,通过微软的云服务 Azure 提供其大模型的访问。这笔交易引起了欧盟监管机构的注意。它担心 AI 与科技巨头之间的合作会巩固其权力遏制创新,使科技监管和小公司的竞争变得更困难。
Tumblr 和 WordPress.com 母公司 Automattic 正与 OpenAI 和 Midjourney 磋商出售用户帖子训练 AI 模型。 Automattic 计划发布一个设置,允许用户退出与第三方的数据共享。它已经抓取了 Tumblr 上 2014-2023 年发布的所有公开帖子,其中错误包含了部分非公开帖子,目前还不清楚它如何处理这些数据,哪些数据会发送给 OpenAI 和 Midjourney 训练模型。在这之前,Reddit 与 Google 签订了每年 6000 万美元的协议,使用其平台上的用户数据训练 Google 的 AI 模型;Shutterstock 则与 OpenAI 签署了协议用其照片库训练模型。
微软与法国 AI 创业公司 Mistral 达成协议,收购后者的少数股权。Mistral 宣布了其最先进的大模型 Mistral Large 首次通过微软的云服务 Azure 提供。Mistral 的大模型是开源的,相比下 OpenAI 是闭源的,数据和代码都不向外公开。Mistral 的大模型是目前最先进的开源大模型,测试显示 Mistral Large 仅次于 OpenAI 的 GPT-4。它去年 12 月融资时的估值为 20 亿欧元。
AI 创业公司 Stability AI 宣布其最新一代的文本图像模型 Stable Diffusion 3 开放预览。感兴趣的用户可以申请加入等候名单。Stability AI 称开放预览是为了在正式发布前收集与性能和安全性相关的用户反馈。Stable Diffusion 3 模型的参数规模从 8 亿 到 80 亿不等,其架构组合了 diffusion transformer 和 flow matching,技术报告将在晚些时候公布。
在引发争议之后 Google 周四暂停了 Gemini 的图像生成功能。在这之前用户在社交媒体抱怨,Google 的 AI 工具将历史人物如华盛顿生成为有色人种。Google 表示它将很快发布一个改进版本。Gemini 产品高级总监 Jack Krawczyk 称,历史背景对 AI 聊天机器人而言有更多细微玄妙之处,他们将对其展开进一步的调整。
李开复的 AI 初创公司 01.AI 去年 11 月跃居开源人工智能系统能力排行榜的榜首。它的部分技术是基于 Meta 公司开源的大模型 LLaMA。李开复对此在邮件中表示,他的初创公司的人工智能模型是建立在 LLaMA 上的,就像“其他大多数 AI 公司一样”,并补充说,使用开源技术是一种标准做法。他说,他的公司使用自己的数据和算法,从零开始训练人工智能模型。这些都是 01.AI“表现出色”的“主要决定因素”。Meta 发言人表示,公开分享该公司的 AI 模型有助于传播其价值观和标准,进而有助于确保美国的领导地位。一位投资公司的合伙人称,中国公司从零开始建立的 AI 模型“不是很好”,所以许多中国公司经常使用“西方模型的微调版”。
OpenAI 的名字中有 Open,但它的大模型不开放也不开源,如今开源大模型主要来自于巨头如 Meta 和 Google。Google 宣布了它最新的开放大模型 Gemma。Gemma 由 Google DeepMind 等团队开发,是轻量级的大模型,有两个版本:Gemma 2B 和 Gemma 7B。Google 称这两个版本在各自的参数规模上展现了最佳的性能,甚至超过规模更大的模型。在基准测试中,Gemma 7B 的得分与目前最优秀的开源大模型 Mistral 7B 差不多或更好。
苹果准备推出类似 GitHub Copilot 的辅助编程工具,使用生成式 AI 帮助补充完成代码。该工具将作为下一个 Xcode 大版本的一部分推出,苹果已在该项目上工作了一年时间,预计最快今年推出,苹果最快在 6 月举行开发者大会 WWDC 上宣布这一新工具。微软的 GitHub Copilot 是在 2021 年推出的,能根据自然语言查询生成代码。
易于使用的模型管理应用 Ollama 发布了 Windows 预览版,Windows 用户可以在本地创建和运行大模型。目前该版本只支持英伟达的 GPU,需要 CPU 支持 AVX 和 AVX2 等指令集。开发者表示对 AMD GPU 的支持还在开发之中,如果用户有能力可以直接从源码去构建支持 AMD GPU 的版本。
社媒平台 Reddit 与一家 AI 公司签订合同使用其平台内容训练模型。该 AI 公司未具名,Reddit 未来可能会签署更多类似的合同。Reddit 此举可能会在其用户中间再次引发争议。Reddit 不生产内容,它的所有高质量内容都是由其用户产生和管理的。去年 Reddit 宣布对 API 访问收费时曾引起社区的大规模的抗议。据彭博社报道,最新的交易根据年化基础价值约 6000 万美元。
美国专利商标局(USPTO)拒绝了 OpenAI 的 GPT 商标申请,认为 GPT 属于描述性术语,不能注册为商标。GPT 代表 Generative pre-trained transformers,是一种深度神经网络架构,基于 Google 研究员在 2017 年公布的深度学习架构 Transformers。OpenAI 申请商标旨在禁止其他人将其模型称为 GPT X 或后缀为 GPT 的名字。USPTO 去年 10 月已经拒绝了一次,这次是最终裁决,它认为 GPT 没有达到注册商标的标准。而 OpenAI 认为它让 GPT 这一名字变得家喻户晓。USPTO 指出 GPT 已在其他情景被其他公司使用。
Google 的大模型以及 AI 聊天机器人都采用 Gemini 这一名称。目前的大模型版本号是 1.0,它的付费版叫 Gemini Advanced,用户可以访问 1.0 Pro 和 1.0 Ultra——其中 1.0 Ultra 是类似 GPT-4 的规模最大的模型,而 1.0 Pro 是类似 GPT-3.5 的中等规模模型。现在 Google 宣布了下一代的 Gemini 1.5,表示其中等规模模型 1.5 Pro 在性能上接近了上一代最大模型 1.0 Ultra,上下文窗口能达到 100 万 tokens,这意味着 1.5 Pro 能一次性处理 1 小时视频、11 小时音频、逾 3 万行代码,或逾 70 万单词。Gemini 1.5 是基于 Transformer 和 MoE 架构,感兴趣的用户需要申请加入等待名单。
OpenAI 宣布了视频生成模型 Sora,并公布了一份相关的技术报告。Sora 能生成最长 1 分钟的高清视频,OpenAI 公布了数十个示例,展现了其惊人的文本生成视频能力。大模型使用 text tokens 统一代码、数学和自然语言的不同文本形式,而 Sora 使用了 visual patches 统一了所有类型的视觉数据。OpenAI 表示,Sora 能够根据文本指令生成长达 60 秒的视频,同时保持视觉质量并遵守用户提示。Sora 可生成具有多个角色、特定类型运动以及精确主题和背景细节的复杂场景。该模型对语言有深刻理解,能够准确领会提示,生成令人信服的角色。Sora 还可以在单个生成视频中创建多个镜头,准确保留角色和视觉风格。除了能仅从文本指令生成视频外,该模型还能够利用现有的静止图像从中生成视频,精确地将图像内容动画化,也可以利用现有视频进行扩展或填充缺失的帧。Sora 仍在开发中,存在明显“弱点”,特别是在提示空间细节方面会混淆左右,也无法理解因果关系的具体实例,比如制作了一个视频,视频中有人咬了一口饼干,但之后饼干上没有咬痕。
微软正在为 Windows 11 开发类似 DLSS 的 AI 上采样技术。在现有的上采样技术中,DLSS 是英伟达私有的技术,且只支持英伟达显卡;AMD 的 FSR 为开源的,基本支持所有平台;英特尔的 XeSS 类似 FSR 也不限于支持自家的 Intel Arc 显卡。微软将其上采样技术描述为利用 AI 技术让支持的游戏运行更流畅细节更丰富。
2006 年,德国 AI 研究员 Marcus Hutter 宣布了人类知识无损压缩 Hutter 奖,总奖金 5 万欧元。2020 年奖金金额提高到 50 万欧元,而 Hutter 如今在 Google DeepMind 担任高级研究员。该奖项旨在鼓励 AI 研究,组织者认为文本压缩和 AI 是一个等价问题。用数学家 Gregory Chaitin 话说,压缩就是理解。压缩的对象是一个特定版本的英文维基百科文本,一开始是 100MB 大小,2020 年提高到 1GB,规则是每改进 x% 就获得等价比例的奖金,如改进 1% 就奖励 5 千欧元。Hutter 奖此前颁发了五次,其中四次是颁给了 Alexander Ratushnyak。去年 7 月纽约高频/算法交易和金融服务基金的量化开发者 Saurabh Kumar 将 10 亿字符压缩到 114,156,155 字节,压缩率 11.41%,比之前的记录改进了 1.04%,因此赢得了 5187 欧元奖金。时隔半年之后,Kaido Orav 的压缩程序 fx-cmix 将 10 亿字符压缩到 112 578 322 字节,比去年的纪录改进了 1.38%,获得了 6911 欧元奖励。
搜索巨人热衷于改名,现在它的生成式 AI 聊天机器人从 Bard 改名为 Gemini。相比 OpenAI 的 ChatGPT,Gemini 和 Bard 一样都不是那么容易与 AI 联系起来。相比 OpenAI 的免费版 GPT-3.5 和付费版 GPT-4(或 ChatGPT 和 ChatGPT Plus),Gemini 的付费版叫 Gemini Advanced,用户可以访问 Pro 1.0 和 Ultra 1.0——其中 Ultra 1.0 是类似 GPT-4 的大模型的首个版本,而 Pro 1.0 是类似 GPT-3.5 的规模较小的模型的首个版本。