文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
欧洲议会、欧盟成员国和欧盟委员会三方,终于在漫长谈判后,就《人工智能法案》达成协议。这一法案将成为全球首部人工智能领域的全面监管法规。已达成协议的《人工智能法案》草案规定,严格禁止“对人类安全造成不可接受风险的人工智能系统”,其中包括有目的地操纵技术、利用人性弱点或根据行为、社会地位和个人特征等进行评价的系统等。相关规定还包括,人工智能公司要对其算法进行人为控制,提供技术文件,并为“高风险”应用建立风险管理系统。每个欧盟成员国都将设立一个监督机构,确保这些规则得到遵守。法案正式颁布实施后,各成员国将基于本国的公共政策基础,做出一定的变通适用。
Meta 发布了一个免费的文本图像生成网站 Imagine with Meta AI(需要登陆)。它的图像生成器是基于其 Emu 图像合成模型,用了 11 亿 Instagram 和 Facebook 上公开可见的照片训练。你的 Facebook 或 Instagram 的公开照片很可能被用于训练 Emu 了,不想被训练的话可以将自己的照片设为私有。Instagram 上每天上传的照片数以亿计,Meta 只使用了很小一部分去训练其模型。在 Imagine with Meta AI 上输入提示词,它会返回四张 1280×1280 像素的图像,可以以 JPEG 格式下载保存,图像左下方会打上水印 Imagined with AI。
Google 发布了 AI 大模型 Gemini,称比 OpenAI 的最新大模型 GPT-4 更先进。Gemini 目前已经整合在搜索巨人的聊天机器人 Bard 中提供给英文版用户。Google 称,Gemini 1.0 有多个针对不同规模的优化版本——Ultra、Pro 和 Nano,其中 Gemini Ultra 在基准测试中的表现超过了 GPT-4。Gemini 具有多模能力,能概括和无缝理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。Google 将在明年初发布使用其最强大模型 Gemini Ultra 的 Bard Advanced 版本,商业化相关信息尚未宣布。
Meta 和 IBM 发起了一个由 50 多家 AI 公司和研究机构组成的联盟,推动 AI 开源模式,支持 AI 领域的“开放式创新和开放式科学”。自 OpenAI 一年前推出 ChatGPT 以来,生成式 AI 已经成为了技术讨论的焦点话题。OpenAI 及其竞争对手,比如 Anthropic 和 Cohere,在开发先进的AI模型方面大体都处于领先地位,这些模型被构建为封闭式或自有系统,由它们的创建者管理,使用这些AI系统的公司要向开发者付费。
Google DeepMind 和华盛顿大学等机构的研究人员上月底发表了一篇论文,介绍了一种对 OpenAI ChatGPT 的攻击方法:他们让 ChatGPT 3.5-turbo 一直重复特定单词。AI 机器人会一遍遍返回同一个单词,直到达到某个限制,之后机器人开始返回从互联网上抓取的训练数据集,这些数据集会包含敏感的用户身份信息。这一攻击披露之后,OpenAI 限制了 ChatGPT 重复单词的次数。机器人在重复几十或几百次之后会停止输出相同单词,表示无法继续下去。
区分人类和机器人的图灵测试 CAPTCHA 对人类构成的挑战可能比机器人更大。加州欧文和微软的一项研究发现,对于图像网格形式的 CAPTCHA 测试,人类平均需要花 15 到 26 秒完成,正确率 81%。相比下,机器人平均花 19.9 秒,正确率 83%。在与机器人展开的军备竞赛中,CAPTCHA 测试给人类造成的麻烦愈来愈大,而且完成此类测试更像是免费帮助企业训练 AI 模型。用户应该会注意到,图像网格的 CAPTCHA 测试越来越多的让用户去识别公交车、交通灯、人行横道之类的对象,这是自动驾驶汽车系统常见的对象识别。Google 曾在 2014 年承认使用 reCAPTCHA 和街景,让人类帮助识别模糊的数字。它现在不需要这么做了,搜索巨人最新的系统 reCAPTCHA v3 是通过监控用户活动去识别访问者是人类还是机器人。
AI 创业公司 Hugging Face 和卡内基梅隆大学的研究人员发现,生成 AI 图像的碳足迹相当于给智能手机充满电,而 AI 生成文本的碳足迹相当于给智能手机充了 16% 的电。研究人员分析了 13 种生成式 AI 任务的碳排放,除了生成图像和文本,还有摘要、对象检测、文本分类等。每项任务研究人员都会运行 1000 个提示词,收集期间消耗的电力和碳排放。结果显示图像生成的排放量最高,文本分类最低。生成图像的平均耗电量为 0.007 度电(KWh),是文本分类的三倍以上(0.002 度电)。
《纽约客》发表长文,讲述了 OpenAI 董事会短暂解雇 CEO Sam Altman 的背后故事。文章称,董事会的部分成员发现 Altman 是一位令人感到不安的狡诈圆滑之辈。董事会成员、乔治城大学安全与新兴技术中心主任 Helen Toner 与人合著发表了一篇论文《Decoding Intentions》,其中温和的批评了 OpenAI 对 AI 的炒作。Altman 知道之后直接找上了 Toner,Toner 为自己辩护,之后还向董事会道歉。Altman 开始逐个与董事谈话讨论替换 Toner。当董事们互相交流谈话内容时,他们发现 Altman 不诚实的告诉其他人说他们支持替换 Toner。撒谎挑拨关系的手法 Altman 已经使用了好多年。因为他的战术风格令人畏惧,当四名董事 Toner、D’Angelo、Sutskever 和 Tasha McCauley 讨论解雇 Altman 时他们想要出其不意。如果 Altman 提前知道的话,他肯定会竭尽所能破坏董事会。董事会成员认为他们解雇 Altman 是为了履行其义务。Hugging Face 负责伦理的首席科学家 Margaret Mitchell 认为 Altman 重新担任 OpenAI CEO 会产生寒蝉效应,公司内部会有愈来愈少的人公开说话。
Google DeepMind 开发出一种新 AI 工具 graphical networks for material exploration (GNoME),使用深度学习帮助加快新材料的开发。从电动汽车电池到太阳能电池到微芯片,新材料推动了技术突破,但新材料的发现通常需要数月甚至数年的反复试验。GNoME 之于材料学相当于 AlphaFold 之于蛋白质折叠,在使用现有科学文献训练之后能预测候选材料的结构。它已经预测了 220 万种新材料的结构,其中逾 700 种已在实验室里创造出来,正进行测试。美国劳伦斯伯克利国家实验室的研究人员开发出一种自动化实验室,与 DeepMind 合作,将新材料的设计自动化。
AI 生成的图片有版权吗?北京互联网法院周一裁决 AI 生成图片应当被认定为作品,受到著作权法保护。本案原告通过开源文本图像模型 Stable Diffusion 使用关键词如日本偶像生成了 AI 图片发布在小红书上。数天后被告将该图片用于百度的百家号账号,发布时裁剪了水印。原告要求被告道歉并赔偿。北京互联网法庭认定原告享有涉案图片的著作权,要求被告向原告赔礼道歉,并赔偿人民币 500元。法院认为,尽管该图片是使用 AI 工具生成,但原告进行了一定的智力投入,例如选择模型、提示词和设置相关参数等。法庭称,原告是涉案图片的作者,享有涉案图片的著作权。
亚马逊 AWS 推出了针对企业客户的 AI 聊天机器人 Q,向微软和 Google 发起了挑战。微软支持的 OpenAI 在大约一年前推出了 AI 聊天机器人 ChatGPT,ChatGPT 普及了生成式 AI,它能根据几行输入生成类似人类书写的文本。Q 有多个版本,企业客户每月支付 20 美元,针对开发者和 IT 工作人员的功能加强版每月收费 25 美元。相比下,微软与 Google 的类似服务 Microsoft 365 的 Copilot 和 Google Workspace 的 Duet AI 的费用都是每月 30 美元。
算法交易公司 XTX Markets 发起了总奖金 1000 万美元的 AI 数学奥林匹克奖,支持者包括了 UCLA 教授陶哲轩等人。该挑战基金旨在推动开发能执行数学推理的 AI 模型,鼓励创造出能在数学奥林匹克竞赛中获得金牌的 AI 模型,模型需要公开分享。AI 数学奥林匹克奖的大奖为 500 万美元,颁发给第一位达到金牌标准的 AI 模型。
英伟达通知中国客户,将推迟到明年一季度发布中国特供版 AI 芯片。英伟达将特供三款 AI 芯片 HGX H20、L20 PCle 和 L2 PCle,它们全都由 H100 改良而来,推迟发布的是其中最强大的 H20,有可能延迟到明年 2 月或 3 月。知情人士称,推迟的原因被告知是服务器制造商在集成芯片上遇到问题。另外两款中 L20 不会延期, L2 情况未知。
在 AI 聊天机器人的帮助下,生成支持未经验证的科学假设的虚假数据集比以往任何时候都容易。AI 生成足以以假乱真数据集的能力增加了研究人员和期刊编辑对科研诚信的担忧。在发表在《JAMA Ophthalmology》期刊上的论文中,研究人员利用了 GPT-4 和 Advanced Data Analysis (ADA),生成了数据集去对比两种手术程序的结果,错误的表明一种手术优于另一种手术。论文合作者 Giuseppe Giannaccare 表示,他们的研究目的旨在突出你可以在几分钟内生成以假乱真的数据集。这种虚假数据集比虚假论文更难分辨。
DeepMind 新 AI Student of Games 能在需要不同策略的游戏中击败人类玩家。该公司表示,这是朝着能够以超人的表现执行任何任务的通用人工智能迈出的一步。Student of Games 源于能在扑克比赛中击败人类职业选手的 DeepStack 和在围棋等比赛中击败最优秀人类棋手的 AlphaZero。这两种模型的不同之处在于,一种专注于不完美的知识游戏——玩家不知道其他玩家的状态,比如扑克游戏中的手牌;另一种专注于完美的知识游戏,比如国际象棋,双方玩家在任何时候都能看到所有棋子的位置。这两者需要根本不同的方法。
Google 的 AI 聊天机器人 Bard 在集成 YouTube 之后能为用户汇总一则视频的关键信息,比如食谱,用户无需点击播放键。这一功能可能影响 YouTube 上的内容创作者的收入,因为用户不会看到广告了。以有逾 200 万订阅者的 America's Test Kitchen 频道为例,浏览它的完整食谱是需要收费的。现在 Bard 能准确的为你描述该频道视频讲述的食谱和制作过程。对内容创作者而言 Bard 的新功能不是好消息。
亚马逊开始提供生成式 AI 免费教程,帮助世界各地的学习者拓展关键技能。亚马逊称它的研究显示,73% 的雇主将招募 AI 人才作为首要任务,但其中四分之三的雇主找不到他们需要的 AI 人才。雇主预计,如果员工提高 AI 技能,他们的工资将上涨 47%。AI 将成为业务开展方式中不可或缺的一部分,93% 的企业预计未来五年将在其组织中使用 AI 解决方案。亚马逊的学习计划被称为 AI Ready。
亚马逊正在训练代号为奥林匹斯(Olympus)的超大规模语言模型。知情人士称它有两万亿个参数,相比下 OpenAI 的 GPT-4 模型据报道有大约 1 万亿个参数。奥林匹斯团队由 Alexa 前负责人 Rohit Prasad 领导,直接向 CEO Andy Jass 汇报工作。亚马逊认为拥有自己的大模型会让其 AWS 业务更有吸引力,企业客户希望能在 AWS 上访问到性能最好的大模型。目前还没有奥林匹斯发布的时间表。
Google DeepMind 最近发布的 AI 音乐生成模型 Lyria 会使用 SynthID 在生成的音乐中嵌入人耳听不见的水印。此举便于跟踪 AI 音乐的来源。DeepMind 称,人耳应该听不到,也不会影响聆听体验。即使音轨压缩、加速或减速,或者加入噪音,水印仍然能检测出来。DeepMind 称,SynthID 的工作原理是通过将音频波转变为显示声音频谱如何随时间演变的二维可视化。
在发生管理层震荡之后,三位 OpenAI 资深 AI 研究员辞职:研究总监 Jakub Pachocki,AI 风险团队负责人 Aleksander Madry 以及任职七年的研究员 Szymon Sidor。Jakub Pachocki 领导了 GPT-4 以及可能的 GPT-5 的预训练。在 Sam Altman 被解雇之后辞职的联合创始人 Greg Brockman 也是 ChatGPT 和 GPT-4 的核心开发者。目前对 OpenAI 内部发生了什么外界所知不详。