solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年10月26日 17时54分 星期四
来自十二魔
研究人员在 AI 领域取得了一项突破,他们开发出一种神经网络系统,具有类似人类的语言归纳能力。AI 系统能将新学到的单词应用于现有词汇和新的上下文背景中。这种能力被称为系统归纳,是人类认知的重要组成部分。研究人员测试了 ChatGPT 使用的模型,虽然 ChatGPT 具有令人称奇的自然语言对话能力,但在语言归纳上要远逊于新的神经网络或人类。这项研究发表在最新一期的《自然》期刊上。

Android
Wilson(42865)
发表于2023年10月26日 14时35分 星期四
来自影舞
随着生成式 AI 模型的日益普及,越来越多的应用集成了生成式 AI 功能。Google 更新了 Android 开发者政策,要求此类应用包含标记和举报功能。Google 称它想要确保 AI 生成的内容对用户是安全的,能纳入用户的反馈。从明年开始,相关应用需允许用户无需退出应用就能标记 AI 生成的冒犯性内容。应用开发者可以根据这些报告开发出更好的内容过滤和审核功能。

人工智能
Wilson(42865)
发表于2023年10月25日 23时59分 星期三
来自沙皇的邮件
在接连发生两起安全事故之后,加州机动车辆管理局 (DMV) 宣布暂停 Cruise 的无人驾驶出租车业务,撤销了无人驾驶的测试许可。今年 8 月一辆 Cruise 汽车撞上了消防车,导致一人受伤。本月早些时候,一辆汽车将一位行人撞倒在行驶中的 Cruise 汽车前面,汽车探测到了碰撞,停了下来,然后脱离公路,将行人拖曳了大约 20 英尺,当汽车最终停下来时其轮胎可能压在了行人的腿上,视频显示这位行人一直在尖叫求助。美国国家公路交通安全管理局(NHTSA)已对 Cruise 展开调查,调查该公司是否采取足够的预防措施保障行人的安全。加州 DMV 认为允许 Cruise 继续测试对公众不安全。Cruise 如果想要继续运营其出租车业务,汽车上将必须有一位司机。

人工智能
Wilson(42865)
发表于2023年10月25日 23时20分 星期三
来自失眠
芝加哥大学计算机科学教授 Ben Zhao 领导的一个团队开发了一种数据中毒工具 Nightshade,允许艺术家在将作品上传到网上前使用该工具在像素中添加不可见的改动,如果作品被抓取到 AI 训练数据集中,它会导致模型以混乱且不可预测的方式崩溃。该工具旨在反击 AI 公司未经作者许可使用其作品训练 AI 模型的行为。训练数据中毒可能会破坏图像生成模型如 DALL-E、Midjourney 和 Stable Diffusion 的未来迭代,它会导致部分输出无用——狗变成猫,汽车变成牛,诸如此类。相关论文已递交到 Usenix 计算机安全会议接受同行评审。Zhao 表示,他希望数据中毒工具有助于将权力平衡从 AI 公司转向艺术家。他的团队还开发了另一种工具 Glaze,帮助艺术家隐藏个人艺术风格,防止被 AI 公司抓取。它的工作方式与 Nightshade 类似。研究团队计划将 Nightshade 整合到 Glaze 中,并将其开源,让其他人能开发自己的版本。大型 AI 模型使用的训练集可能包含数十亿幅图像,其中的有毒图像越多,造成的破坏就会越大。数据集一旦中毒是很难清理的,它需要公司努力找出并删除每一个损坏的样本。

人工智能
Wilson(42865)
发表于2023年10月25日 15时49分 星期三
来自奇迹男孩与冰霜巨人
英伟达向 SEC 递交文件称,美国政府要求它立即停止向中国出口先进 AI 芯片,而不是原计划的 10 月 17 日起的 30 天后生效。立即限制出口的产品包括 A100、A800、H100、H800 和 L40S,此前列入限制出口的旗舰显卡 RTX 4090 仍然会是 30 天后生效。英伟达称,由于需求强劲,限制向华出口在短期内不会对公司业绩产生显著影响。

人工智能
Wilson(42865)
发表于2023年10月24日 13时02分 星期二
来自外交豁免权
斯坦福大学研究人员发表了《基础模型透明度指数(The Foundation Model Transparency Index)》报告,分析了 OpenAI、Google、Meta、Anthropic 等公司开发的 10 个流行基础模型,用 100 个指标进行了评估。这些指标包括训练数据、劳工实践以及使用的计算量等。结果显示,Meta 的开源模型 Llama 2 得分最高 54/100,OpenAI 的 GPT-4 为 48/100,亚马逊的 Titan 模型得分最低 12/100。研究人员指出,过去三年大模型的透明度在显著下降,原因从企业之间的竞争加剧到 AI 末日的恐慌。OpenAI 放弃了该公司早先对 AI 持有的开放立场,理由是 AI 技术的传播潜在有危险性。研究人员希望企业能增加大模型的透明度,为政府如何监管 AI 模型提供帮助。

人工智能
Wilson(42865)
发表于2023年10月23日 14时09分 星期一
来自苏珊娜之歌
苹果计划在 Siri、Xcode 等产品中整合 AI。苹果已建立了自己的大模型 Ajax,在此基础上还创建了一个聊天机器人服务, 部分工程师称之为“苹果GPT”。下一步的关键是确定该技术是否能应对竞争对手,以及苹果如何将其实际应用到产品中。负责 AI 的高级副总裁 John Giannandrea 的团队正在改进 Siri。这个更智能的 Siri 版本最早可能会在明年准备就绪,但这项技术仍然让人感到担忧,而且苹果的 AI 功能可能需要更长的时间才能在产品线中普及。苹果软件工程团队也在考虑将生成式 AI 集成到 Xcode 等开发工具中,这可以帮助开发人员更快地编写新应用,使其与微软的 GitHub Copilot 等服务保持一致。苹果公司内部正在争论如何部署生成式 AI:完全在设备上运行、基于云运行或介于两者之间。部署在设备上会运行得更快,并有助于保护隐私,但通过云部署大模型将允许更高级的操作。

人工智能
Wilson(42865)
发表于2023年10月20日 17时58分 星期五
来自人性分解
IBM 的研究人员在《科学》期刊上发表论文,提出了受脑启发的芯片架构 NorthPole,它能将计算与记忆相结合,并以低能耗高效地处理数据。自计算机诞生以来,计算过程一直以处理器为中心,记忆内存与计算是分离的。然而在记忆内存和计算之间穿梭传输大量数据会在能耗、处理带宽和速度方面付出高昂的代价。这在新兴的和先进的实时 AI 应用(如脸部识别、物体检测和行为监控等)中尤其明显,这些应用需要快速获取海量数据。因此,大多数现代计算机架构正在迅速达到物理和处理瓶颈,而且鉴于所涉及的能源成本不断增长,其在经济、技术和环境上都面临着无法持续的风险。NorthPole 是一种将计算与记忆内存交织于单个芯片上的神经推理架构,对 ResNet50 的测试显示,它能将每瓦每秒帧数 (FPS) 的能量指标提高 25 倍,每个晶体管的 FPS 的空间指标提高 5 倍,相对于同类技术延迟的时间指标降低 22 倍。

人工智能
Wilson(42865)
发表于2023年10月20日 15时15分 星期五
来自梦境救援
微软、Google、MIT 的研究人员与古腾堡项目合作制作了 5000 本开放授权的有声读物,音频总时长 3.5 万小时,包含了虚构和非虚构类作品,每个人都能找到适合自己的内容。研究人员的论文《Large-Scale Automatic Audiobook Creation》发表在预印本平台 arXiv.org,他们指出,对于视障人士、年轻儿童,甚至语言新手来说,有声读物能“显著提高文学作品的易读性”。这批有声读物 The Project Gutenberg Open Audiobook Collection 可以通过各大平台的播客应用获取。

人工智能
Wilson(42865)
发表于2023年10月18日 23时24分 星期三
来自血族3:永夜
科技领袖周二表示,AI 将对劳动力带来巨大变革,将会消除许多职业,要求社会重新思考人们如何度过时间。从医生到作家的各类专业人士已经在担心 A I会完全取代某些岗位。但 Adobe 的数字媒体业务总裁 David Wadhwani 称,尽管存在相关担忧,但他认为 AI 是一种能促进就业而不是让人失业的工具。他表示,Adobe 的Firefly等工具可以生成图像和标识,让更多人成为创意专业人士。风险资本家 Vinod Khosla 称,目前对 AI 的大多数风投都将赔钱。AI 投资已进入炒作阶段,只有高度自律的投资者才能通过押注这项变革性技术而获利。Khosla 还警告说不要将先进AI模型背后的代码公之于众。一些技术专家主张公开代码可以促进这项技术的发展。他说:“你不会将曼哈顿计划开源。”

人工智能
Wilson(42865)
发表于2023年10月17日 21时32分 星期二
来自奇迹之夏
李彦宏在百度世界 2023 大会上宣布了最新版本的文心大模型4.0,称综合能力“与GPT-4相比毫不逊色”。文心大模型4.0 目前处于邀请测试阶段。李彦宏演示了最新大模型的四大能力的特点与应用场景。在理解能力上,他通过询问公积金异地贷款政策的案例,展示了文心一言对前后乱序、模糊意图、潜台词等复杂提示词的理解力,例如“在北京工作”等同于“在北京缴纳公积金”等,“今天,你说的每一句话,它大概率都能听懂”。在生成能力上,李彦宏展示了文心一言如何在短短几分钟内,根据一张素材图片,迅速生成了一组广告海报、五条广告文案,以及一条营销视频。他还通过解数学题、总结知识点等场景,展示了大模型的逻辑能力;通过数千字的小说撰写和角色、情节设置,体现了大模型的记忆能力;以及数字人医生帮助患者解读药品说明书,来展现四大能力的综合应用。百度表示将基于最新模型更新搜索引擎、地图等应用。和其它提供大模型的国内企业类似,使用大模型都基于实名制。

人工智能
Wilson(42865)
发表于2023年10月16日 18时03分 星期一
来自消失吧!书本
一个国际科学家团队正利用 ChatGPT 背后的技术构建用于科学发现的 AI 工具。该项目被称为 Polymathic AI,研究人员已经在 arXiv 上发表了一系列论文预印本。ChatGPT 是利用从互联网上搜集的文本数据集进行训练,而 Polymathic AI 将从不同科学领域的数值数据和物理模拟进行训练,帮助科学家对从超巨星到地球气候的各种现象进行建模。从已有的预训练大模型开始,而不是从头构建科学模型,要更快更准确。研究人员表示,Polymathic AI 有望展示不同领域之间可能被忽视的共性和联系。

人工智能
Wilson(42865)
发表于2023年10月15日 22时30分 星期日
来自幻想曲
训练 AI 和运行 AI 都是能量密集过程。AI 公司 Hugging Face 报告称,其多语言文本生成 AI 工具在训练期间消耗了约 433 MWH 的电力,足以为 40 个普通美国家庭供电一年。荷兰阿姆斯特丹自由大学的 Alex de Vries 指出,每当 AI 工具生成文本或图像时,它也会使用大量的计算能力和能源。例如 ChatGPT 每天运行可能需要 564 MWH 的电力。虽然,世界各地的公司都在努力提高 AI 硬件和软件的效率,以降低这种工具消耗的能源,但机器效率的提高往往会增加需求。最终,技术进步将导致资源使用的净增加,这种现象被称为杰文斯悖论。De Vries 说:“提高这些工具的效率和易用性的结果可能是,我们允许更多的应用程序和更多的人使用它。”研究人员估计,如果每一次 Google 搜索都使用 AI,每年将需要大约 29.2 TWH 的电力,这相当于爱尔兰一年的用电量。到 2027年全球 AI 相关的用电量预计每年将增加 85~134 TWH。这相当于荷兰、阿根廷、瑞典等国家的年用电量。

人工智能
Wilson(42865)
发表于2023年10月14日 23时48分 星期六
来自其主之声
Herculaneum 纸草卷轴是庞贝附近一座私人别墅图书馆的藏品,因公元 79 年维苏威火山喷发而被掩埋,在高温下碳化。1752 年它们被挖掘出来。它们非常脆弱,处理不当就会变成灰烬。如何阅读无法打开的卷轴?这个问题持续了数百年。2019 年肯塔基大学 EduceLab 的 Brent Seales 教授使用粒子加速器对 Herculaneum 卷轴进行了成像,生成了分辨率达 4 µm 的 3D CT 扫描。他的团队还扫描拍摄了有可见墨水的卷轴碎片。企业家 Nat Friedman 和 Daniel Gross 对该项目产生了兴趣,他们在 2023 年 3 月发起挑战赛 Vesuvius Challenge,奖励能识别卷轴文字的人。8 月参赛者 Casey Handmer 报告在 CT 扫描中发现了看起来像是墨水的“裂纹图案”。SpaceX 暑期实习生 Luke Farritor 开始对裂纹图案训练一个机器学习模型,每一个新裂纹的发现都帮助改进了模型。模型很快揭露了人眼看不见的裂纹痕迹,他发现了卷轴的第一个文字——ΠΟΡΦΥΡΑϹ ——意思是紫色的。他赢得了 4 万美元的 First Letters Prize 奖。另一名参赛者 Youssef Nader 也在同一区域发现了相同文字,她作为第二名赢得了 1 万美元。Casey Handmer 作为墨水痕迹的首位发现者获得了 1 万美元的 First Ink Prize。

人工智能
Wilson(42865)
发表于2023年10月13日 16时19分 星期五
来自凡尔纳地球三部曲
微软本周向 Windows Insiders 测试者推送了新版的绘图应用(Paint app),其中包括了 Paint Cocreator,基于 DALL-E 的 AI 文本图像生成功能,用户可通过简短文字去描述想要生成的内容,选择不同的艺术风格,然后点击 Create。Paint Cocreator 将生成一组图像供用户选择。微软称 AI 图像生成功能内置有内容过滤器,防止生成有害的、冒犯性的或不合适的图像。

人工智能
Wilson(42865)
发表于2023年10月12日 20时11分 星期四
来自泰山和蚁人
Google 通过 Discord 邀请了部分 AI 聊天机器人 Bard 的重度使用用户,一起聊天讨论了 AI 工具的有效性和实用性,Google 的产品经理在讨论期间质疑了大模型的可用性。Bard 高级产品经理 Dominik Rabiej 在 7 月的 Discord 聊天中表示,他的经验法则是,除非能独立验证不要相信大模型的输出结果。负责 Bard 用户体验的 Cathy Pearl 说,他认为最大的挑战是,就有用性而言,大模型最擅长什么。Rabiej 则建议将 Bard 作为“创意/头脑风暴应用”使用,也可以将 Bard 用于辅助编程,因为编程的话用户肯定需要检查代码是否有效。

人工智能
Wilson(42865)
发表于2023年10月12日 17时36分 星期四
来自繁星若尘
Adobe 演示了其开发的实验性 AI 上采样技术,能将低分辨率 GIF 动图和视频片段放大到高分辨率。该项目被称为 Project Res-Up,Adobe 尚未提供开放测试,它使用了基于 diffusion 的上采样技术提升视频分辨率,同时改进清晰度和细节。在演示中,Adobe 从 《The Red House(1947)》提取了一段 480 x 360 分辨率的片段,使用上采样放大到 1280 x 960,总像素增加 675%。生成的视频更清晰,AI 移除了绝大部分的模糊,甚至添加了发丝和高亮等新细节。

人工智能
Wilson(42865)
发表于2023年10月11日 21时29分 星期三
来自图书馆员与黄金锅
当西雅图华盛顿大学医学院的 Domenico Mastrodicasa 医生在写论文遇到困难时他会求助于 ChatGPT,聊天机器人会在几秒钟内响应查询。他是众多使用生成式 AI 帮助撰写论文的研究人员之一。他购买了付费版本 ChatGPT Plus,每周使用数次,认为它对帮助他理清思路非常有用。很多人预测生成式 AI 将成为撰写论文手稿、同行审议报告和拨款申请的常规助手,认为非母语为英语的研究人员将会受益最多。部分研究人员认为这意味着他们可以将时间更多的投入在研究而不是论文撰写上。加州伯克利的 Michael Eisen 说,写论文从来不是真正的目的,搞科学才是。但生成式 AI 难以避免的不精确性和捏造的内容将是科学出版面临的一大难题。出版商担心这可能会意味着出现更多错误百出的手稿。

人工智能
Wilson(42865)
发表于2023年10月10日 15时29分 星期二
来自苹果树下的宇宙飞船
生成式 AI 热潮给很多公司带来了巨额利润,其中受益最大的可能是 GPU 芯片供不应求的英伟达了。而微软据报道难以受益于其 AI 业务。它为程序员提供的 AI 编程助手 GitHub Copilot 就一直亏损。GitHub Copilot 于 2022 年 6 月推出,月费 10 美元或年费 100 美元。身份验证过的学生和知名开源项目开发者可免费使用。据知情人士透露,微软今年初每月每位用户平均损失逾 20 美元,部分用户损失最高逾 80 美元。微软一直尝试降低 AI 服务费用,其中之一是自研而不是依赖英伟达供应 AI 芯片。软件巨人最早可能会在下个月的 Ignite 大会上宣布其 AI 芯片。

人工智能
Wilson(42865)
发表于2023年10月08日 23时16分 星期日
来自金刚
学习英语对人类而言并非易事,但计算机学习英语的方法十分简单:将互联网上收集的海量文本输入到名叫神经网络的数学模型中。这是 OpenAI ChatGPT 等生成式 AI 模型背后的工作原理。但这种方法的缺点也十分明显:训练成本昂贵且耗费大量时间。大语言模型的黑箱也让人难以理解其内部工作以及为什么会失败。面对困难,部分研究人员选择了在小型数据集上训练小型模型,然后研究其行为。微软研究人员最近在预印本平台 arxiv.org 上发表论文,介绍了一种训练微型语言模型的新方法:用儿童故事培养它们。 ChatGPT 使用的 GPT-3.5 模型有近 2000 亿个参数,需要至少 1000 个 GPU 训练数周时间。只有少数公司能获得必要的资源。但微软研究人员的研究表明,规模仅为最先进大语言模型数千分之一的微型语言模型在这种方法训练下能很快学会讲述一致且语法正确的故事。这项研究结果或能为新研究指明方向。