文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
52 岁的佛罗里达男子 Wendell Doyle Goney 本周认罪,他作为一名已定罪重罪犯而持有武器,并使用武器击落了警方无人机,他面临 10 年徒刑,其判决将在明年 1 月 18 日宣布。警方是在 2021 年 7 月出警回应一起入室盗窃案,当使用价值 2.9 万美元的无人机进行户外搜索时,无人机被 Goney 从附近住宅区使用步枪开枪击落。Goney 声称无人机令其不甚烦恼。记录显示,Goney 犯有 29 项重罪,包括恶意伤害警官、暴力拒捕、非法持有毒品、入室盗窃,以及已定罪重罪犯而持有武器。美国联邦法律禁止大多数已定罪重罪犯持有武器。
为了妥善利用生成文本和图像的生成式 AI,日本政府正推进制定面向企业等的指导方针。草案显示不仅是 AI开 发商和服务提供商,使用 AI 开展业务的企业和团体也将承担一定的责任。指导方针明确了创造 AI 基础性技术的“算法开发者”、提供基于 AI 的服务和软件的“服务实施者”以及运用 AI 开展业务的企业等五大业务主体须共同担负责任和义务。草案指出,社会所追求的方向是“开发和使用 AI 是为了拓展人们的能力,使追求幸福成为可能”,“不得以企图侵犯人权、实施恐怖主义及犯罪为目的、或助长上述行为的不当输入输出方式提供或使用 AI”。
生成式 AI 使用的 GPU 基本上指的都是英伟达的产品。英伟达被广泛视为是一家硬件公司,但它的软件工程师数量多于硬件工程师。它对使用其软件工具(CUDA)设定了非常低的门槛,围绕其硬件构建了强大的软件护城河。完全依赖于英伟达的产品对生成式 AI 领域的众多科技公司而言并非好事,其中一大问题是英伟达的产品供不应求。部分大公司拥抱了自研 AI 芯片,而 AMD 和英特尔等也都努力进入这一市场。因为 CUDA 工具的广泛使用,即使不使用英伟达的硬件,其它公司的 GPU 和加速器仍然需要设法支持 CUDA。PyTorch 已经将用户与底层 GPU 架构分离开来,而 AMD ROCm 提供了 CUDA 的开源替代,今天跨越 CUDA 护城河可能就像使用 PyTorch 一样简单。
路透援引知情人士的消息报道,OpenAI 正探索自己制造 AI 芯片,评估潜在收购目标。该公司尚未决定是否推进该计划。目前 AI 芯片主要依赖于英伟达的芯片,该公司控制着逾八成的市场份额。OpenAI 想要 AI 芯片供应的多元化。OpenAI 的聊天机器人 ChatGPT 运行成本昂贵,分析师估计每次查询的成本为 4 美分。如果 ChatGPT 的查询份额达到 Google 的十分之一,那么 OpenAI 早期阶段需要价值 481 亿美元的 GPU,后续运行每年还需要 160 亿美元的芯片。
Google DeepMind 和 Meta 的研究人员在预印本平台 arXiv 上发表论文《Language Modeling Is Compression》,他们发现 DeepMind 的大语言模型 Chinchilla 70B 在图像和音频的无损压缩上超过了 PNG 和 FLAC。Chinchilla 70B 能将 ImageNet 图像数据库无损压缩到原始大小 43.4%,超过了 PNG 算法的 58.5%。Chinchilla 能将 LibriSpeech 音频数据集中的样本无损压缩到原始大小 16.4%,超过 FLAC 算法的 30.3%。Chinchilla 70B 主要是训练去处理文本,但它在压缩其它类型的数据集上的效果也表现优异,甚至优于专门的算法。
AI 模型需要大数据集训练,那数据集来自何处呢?网民。AI 要快速变现,最方便的途径是什么呢?显然是监控。Signal 总裁 Meredith Whittaker 对此评论道,AI 本质上是一种监控技术。这是依赖于货币化用户数据的企业对 AI 十分热衷的一个原因。AI 有助于巩固和扩展监控商业模式。她说,当你走过一个面部识别摄像头,它配备了伪科学的情绪识别功能,它会生成你的数据,不管对错,会说你“快乐、悲伤、脾气不好或骗子”诸如此类。这些终极监控系统正在推销给有权力监控的人,如雇主和政府,其决策和预测将影响我们对资源和机会的获取。
OpenAI 宣布 ChatGPT 的新版本能通过图像和语音与用户交流。举例来说,上传冰箱内部的照片,ChatGPT 能列出根据现有食材可制作的菜肴清单。对于语音交流,用户可选择五种不同的 ChatGPT 的合成声音,其中包括男性和女性声音。新版本将通过 ChatGPT Plus 付费服务提供给客户,该服务月费为 20 美元。语音交流则需要使用 iPhone、iPad 和 Android 设备。ChatGPT 自去年 11 月推出后吸引了数亿用户,新功能将使得 ChatGPT 能挑战 Alexa 和 Siri 等传统语音助手。
盖蒂与英伟达合作发布了 Generative AI by Getty Images,完全使用盖蒂图库的授权图像训练的生成式 AI,将该工具生产的图像商业化会受到法律保护。该工具使用了英伟达的 Edify 模型。测试显示,盖蒂 AI 工具的图像质量与 OpenAI 的 DALL-E 3 相近,优于开源图像模型 Stable Diffusion。Getty 工具对用户生成图片的类型有限制,不允许生成任何真实人名的图像。盖蒂对此表示,它无意操纵或再现现实生活的事件。
Meta 最快将于本周在其各社交媒体应用中发布具有鲜明个性的 AI 聊天机器人,以此吸引年轻用户。AI 机器人正在内部测试,Meta 预计会在周三开始的 Meta Connect 会议上宣布首批 AI 智能体(AI agent)。这些机器人将用来推动用户的参与,不过其中一些机器人也可能拥有与生产力相关的技能,比如帮助完成编码或其他任务的能力。Meta 正计划开发几十个 AI 个性聊天机器人。该公司还在开发一款产品,让名人和创作者可以使用自己的 AI 聊天机器人与粉丝和追随者互动。
亚马逊宣布向 AI 创业公司 Anthropic 投资至多 40 亿美元,推动 AI 军备竞赛升级。此前微软向 OpenAI 投资数十亿美元。作为交易的一部分,Anthropic 将用亚马逊的定制芯片构建 AI 软件,并使用亚马逊的 AWS 云计算服务。亚马逊则将整合 Anthropic 的 AI 技术。Anthropic 开发了 ChatGPT 之外另一个备受瞩目的 AI 聊天机器人 Claude 2,支持最高 100k 上下文。
AI 模型需要大量“点击工人”对数据进行训练,比如教 AI 区分行人和棕榈树,或者组合描述暴力或性虐待的词语。“点击工人”通常来自低工资的南半球国家。比如 OpenAI 雇佣的一家外包公司在肯尼亚、乌干达和印度招募“点击工人”。但南半球国家懂芬兰语的很少。因此芬兰 AI 创业公司 Metroc 找到了监狱劳工帮助它训练大模型。40 多岁的女囚 Marmalade 就成为了一名“点击工人”,她的时薪为 1.54 欧元,轮班时间为 3 小时。芬兰以其开放式监狱闻名——囚犯可以在附近城镇工作或学习。但还有部分监狱是封闭式的,关押重刑犯。Marmalade 被判了 6 年,在一个终身监禁囚犯关押 12 年后可申请释放的国家,6 年是一个重刑。
Google 旗下的 AI 子公司 DeepMind 研发的蛋白质结构预测模型 AlphaFold 获得了拉斯克奖的基础医学研究奖,拉斯克奖颁发三个奖项,另外两个是临床医学研究奖和医学科学特殊成就奖。Demis Hassabis 博士和 John Jumper 博士领导 AlphaFold 团队借助 AI 系统成功解决了蛋白质结构预测难题,实现了准确性和速度的巨大突破。James Fujimoto、David Huang和Eric Swanson 发明的光学相干断层扫描(OCT)技术赢得了临床医学研究奖,OCT 使医生能够迅速检测并治疗影响视力的视网膜疾病,从而拯救了数百万人的视力。医学科学特殊成就奖授予了 Piet Borst。
OpenAI 宣布了它的下一代文本图像生成模式 DALL-E 3。该公司计划 10 月份向 ChatGPT+ 和企业客户提供 DALL-E 3,提供给 API 客户的时间未定,只是表示在秋季的某个时候。OpenAI 称,DALL-E 3 改进了细节处理,此前的模型在手指的生成上会出现问题。新版本也改进了图像内文本的处理。DALL-E 3 还与 ChatGPT 紧密集成,允许 ChatGPT 根据当前对话的上下文生成图像。
亚马逊周三演示了其先进 AI 技术。在其中一场演示中,亚马逊设备业务主管 Dave Limp 展示了 Alexa 加强后的对话功能。在听到用户的自然请求而不是脚本化命令短语后,该语音助手推荐了电影并执行了智能家居例行程序。该语音助手的回答听起来也更自然,用语更加生动,不再是用户多年来听到的固定笑话和回答。新功能的预览版将于今年秋天在家庭现有的 Echo 和 Fire TV 产品中推出。亚马逊表示,即使是 2014 年的原版Echo扬声器也将兼容新功能。
代表知名作家如 John Grisham、Jonathan Franzen、George Saunders、Jodi Picault 和 George R.R. Martin 的美国作家协会周二加入了对 OpenAI 的集体诉讼,指控该公司非法使用作家们的作品训练 AI 聊天机器人 ChatGPT。除了微软支持的 OpenAI,其它 AI 公司如 Meta Platforms 和 Stability AI 也面临类似的诉讼。AI 使用大量版权作品训练之后会生成相似但有差异的内容,因此有时候它被称为是终极洗稿工具。
Google DeepMind 的研究人员在预印本平台 arXiv 发表论文《Large Language Models as Optimizers》,介绍了大模型的一种优化方法:用一个大模型修饰提示,改进另一个大模型的数学能力。初步结果显示,使用“深呼吸,一步步解决问题”的提示效果最为显著,能大幅提升数学测试得分。对 Google 的 PaLM 2 大模型使用该提示,它在小学数学应用题数据集 GSM8K 中的正确率达到了 80.2%,而不使用该提示正确率只有 34%,“让我们一步步思考”提示的正确率为 71.8%。为什么会有如此惊人的变化?大模型显然不会呼吸,也不像人类那样思考和推理。它们所做的推理都源自从书籍和互联网上抓取的短语数据集。其中包括问答形式的论坛,此类论坛包含了大量“深呼吸”,“一步步思考”等短语,后面紧跟着更细致入微的推理方案。这些短语可能有助于大模型产生更好的答案。
Google 宣布它的 AI 聊天机器人 Bard 现在能关联该公司旗下的各种应用和服务。Google 针对英文版发布了 Bard Extensions。Bard 能从用户日常使用的 Gmail、Docs、Drive、Google Maps、YouTube 和 Google Flights 等工具中查找和显示相关信息,即使你所需要的信息跨越了多个应用和服务。举例来说,你准备去大峡谷旅行,可以在一次对话中要求 Bard 从 Gmail 中获取适合每个人的日期,查找实时航班和酒店信息,查看前往机场的 Google Maps 路线,观看相关的 YouTube 视频。
2010 年代,MIT 的 Senseable City 实验室利用大数据分析了打车和拼车如何让街道更干净交通更高效,它的结论是:纽约出租车队的规模能减少 40%,更多的人能花更少的钱乘更少的汽车出行,汽车拥有率能减少,停车场能腾出用于新用途。这项研究在技术上是正确的,但未考虑到人类行为的变化。汽车比步行、公交和地铁更方便更舒适,这是它受欢迎的原因。通过打车和拼车让乘车变得更便宜,人们会远离其它形式的交通。几年后这一结果在数据中凸显出来:打车出行产生了更多的交通量,二氧化碳排放量增加了 69%。无人驾驶出租车也将产生相同的结果。新的技术将会进一步恶化交通。让城市更便捷、更高效和更环保的方法不是新技术而是旧技术。公交、地铁、自行车和双腿步行比硅谷梦想的任何东西都更清洁、更便宜、更高效。与其让自动驾驶技术用于出租车,不如将其用于扩大公共交通。
DeepMind 联合创始人 Mustafa Suleyman 认为生成式 AI 只是一个阶段,下一个阶段是交互式 AI:机器人能通过调用其它软件和呼叫其他人来执行你为它们设置的任务。Suleyman 在 2022 年创办了 AI 公司 Inflection,从微软、英伟达、比尔盖茨和 LinkedIn 创始人 Reid Hoffman 获得了 15 亿美元的投资,今年初推出了 AI 聊天机器人 Pi,其一大特性是有礼貌。他接受采访时表示,人权原则基本上是一种权衡取舍,是一种持续的协商。我们充满了自身的偏见和盲点,所有的一切都是缓慢、低效且容易出错。他认为构建出真正反映人类集体自我的 AI 是可能的,能代表人类做出更好的权衡、更一致且更公平。他认为 AI 的第一波是分类,深度学习表明可以训练计算机对不同类型的输入数据分类。第二波是生成式 AI,第三波是交互式 AI。他长期以来一直坚信对话是未来的界面,你将与 AI 进行交流,而不是点击按钮和打字。未来 AI 将更富有主动性,这将代表着技术的巨大转变。今天的技术是静态的,它只是执行你让它执行的任务。未来的技术在采取行动上将有着某种自由度。
马斯克(Elon Musk)、盖茨(Bill Gates)、扎克伯格(Mark Zuckerberg)等科技行业的高管和名人周三参加了一场闭门会议,与 60 多名美国参议员就 AI 的各种可能性和风险展开了辩论。参议员们正在考虑通过立法监管 AI 技术。马斯克警告称,AI 有可能威胁到人类。盖茨则指出,AI 可能有助于解决全球饥饿问题。非营利组织 Center for Humane Technology 负责人Tristan Harris 警告开源 AI 系统会被滥用,如 Llama 2 模型能被用于获取制造危险生物化合物的指南。扎克伯格反驳说,类似的指南本来就可以在互联网上找到。扎克伯格告诉参议员,开源“使这些工具的获得变得民主化,这有助于公平竞争,促进个人和企业创新”。