文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
大模型正变得越来越强大,但对计算和电力的需求也越来越大。大模型如果要变得廉价、快速而且环保,它们需要大幅缩小规模,以便于能在类似手机的设备上本地运行。研究人员正致力于寻找方法实现这一目标。类似所有神经网络,大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。有两种压缩网络的通用方法,其一是训练后量化(PTQ),其二是量化感知训练(QAT),研究人员更青睐前者。哈工大的车万翔称,PTQ 相对于 QAT 的优点是不需要收集训练数据,不需要重新训练,训练过程更稳定。QAT 的优点则是模型可能更精确,因为量化从一开始就内置在模型中。去年微软亚洲研究院的研究团队创造了第一个 1 位 PTQ 大模型 BBitNet 1.58b,每个参数占大约 1.5 比特内存,有 30 亿参数的 BitNet 在各种语言任务中的表现和相同参数规模的全精度 LLaMA 模型一样出色,但速度是 2.71 倍,用的 GPU 内存少 72%,GPU 能耗低 94%。
路透研究院和牛津大学的研究人员调查了阿根廷、丹麦、法国、日本、英国和美国六国的 12,000 人,发现普通大众并不常用 ChatGPT 等热门 AI 产品,18-24 岁的年轻人是例外。研究旨在衡量普通大众对过去两年火热无比的生成式 AI 的看法,结果显示:多数人预测生成式 AI 未来五年会对社会产生重大影响,新闻、媒体和科学领域受影响最大;多数人认为生成式 AI 将改善自己的生活;关于生成式 AI 对社会的影响多数人普遍悲观。虽然多数人都听说过生成式 AI,但有 20%-30% 的人对此一无所知;ChatGPT 是使用率最高的生成式 AI 产品,比 Google Gemini 和 Microsoft Copilot 高出 2-3 倍;18-24 岁人群中有 56% 至少用过 ChatGPT 一次,55 岁及以上人群中这一比例为 16%;大部分人将生成式 AI 用于获取信息、创建媒体如文本、图像、音频和视频,有 5% 的人将其用于获取最新信息。
法国 AI 创业公司 Mistra 发布了它的代码生成 AI 模型 Codestral。Codestral 使用了逾 80 种语言的数据集训练,其中包括了流行语言如 Python、Java、C、C++、JavaScript 和 Bash。Codestral 有 220 亿参数,上下文长度 32K,能完成代码函数、写测试和补完代码,用写英文回答代码库问题。Mistra 称 Codestral 是开放权重模型,代码可以在 Hugging Face 上下载,使用的是非商业许可证,许可证明确禁止在业务活动中使用,原因可能是使用了不同许可证授权的代码训练。
华盛顿大学团队开发出一种 AI 系统,让佩戴耳机的用户盯着说话的人三到五秒进行“锁定”。被称为“Target Speech Hearing”的系统随后会消除环境中的所有其它声音,只实时传送标记的说话者的声音,即使用户在嘈杂的地方走动且不再面对说话者。该系统可以在现有耳机上使用,概念验证代码发布在 GitHub 上,使用了非商业使用许可证,系统本身尚未发售。系统使用了机器学习软件学习选定的说话者的声音模式,然后锁定说话者的声音。
前 OpenAI 董事 Helen Toner 接受采访时表示,公司董事也是通过 Twitter 才知道 ChatGPT 的。她表示董事会没有提前收到通知。这一信息突出了董事会与公司日常运营之间的脱节。去年 11 月 17 日公司董事会突然解雇 CEO Sam Altman 时给出的一条理由是他在不沟通时不坦诚。Toner 称 Sam Altman 没有告知董事会他拥有 OpenAI 创业基金,他多次声称作为独董与公司没有经济利益。他还向董事会提供了不准确的安全流程信息。两位高管向董事会报告受到了他的“心理虐待”,他的领导风格被指在公司内部催生了“有毒气氛”。对于 Sam Altman 在被解雇五天之后再次重新控制公司,Toner 说员工们认为没有他公司会崩溃,而如果不支持他可能会遭到报复。
为改进 Windows 11 在 Arm 设备上的游戏性能,微软宣布了 AI 驱动的图像超分辨率技术 Auto SR。其工作方式类似现有的超分辨率技术如 DLSS 和 FSR。Auto SR 存在很多限制,目前只支持高通的 Snapdragon X SoC 和 Windows 11 v24H2 或更高版本,以及原生 ARM 游戏和特定的 DirectX11 和 DirectX12 游戏。10 位格式的 DX11 和 DX12 游戏以及 OpenGL、Vulkan 和 DirectX 9 或 8 游戏都不支持。Auto SR 和 HDR 不能同时启用,不支持 1080p 以下的显示分辨率,等等。
彭博社报道,苹果与 OpenAI 达成协议为 iOS 18 提供 AI 聊天功能。苹果将在下个月举行的 WWDC 开发者大会上公布相关消息。苹果不想将所有鸡蛋都放在一个篮子,它仍然在寻求与 Google 达成协议,将搜索巨人的 AI 模型 Gemini 作为 OpenAI 的替代,但预计到下个月的 WWDC 上不会公布相关消息。苹果还在开发自己的 AI 模型 Ajax,用于设备上的文本分析、智能回复和摘要。ChatGPT 等 OpenAI 技术预计将会用于分析长文本、图像生成等高要求任务。
AI 的火爆以及人才的短缺推动了 AI 软件工程师的薪水远高于非 AI 的同行。根据薪资数据网站 Levels.fyi 的数据,截至 2024 年 4 月,美国 AI 软件工程师的平均薪水接近 30 万美元,比非 AI 领域的软件工程师高出约 10 万美元。两者的薪水差距在 2022 年中就达到了 30%,如今进一步扩大到了 50%。数据科学家 Alina Kolesnikova 称,企业愿意为 AI 技能支付溢价薪水,无论你处于什么级别。在部分企业 AI 工程师和非 AI 工程师的薪水差异更为巨大,例如无人出租车公司 Cruise 支付给 AI 工程师的中位数薪水是 68 万美元,比非 AI 工程师高 18.55 万美元。
OpenAI 宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI 将能在 ChatGPT 中显示新闻集团旗下媒体的内容并用于回答用户的问题。同时新闻集团将分享新闻专业知识,以帮助确保 OpenAI 的产品达到最高的新闻标准。知情人士称,该交易为期五年,交易价值或超过 2.5 亿美元,包括现金形式以及使用 OpenAI 技术的信用额度。OpenAI 此前已与 Reddit、《金融时报》、美联社、《世界报》等多家媒体达成内容协议。
Meta AI 首席科学家 Yann LeCun 认为现有的大模型永远也达不到人类水平的智能。他说,大模型对逻辑理解有限,不理解物理世界,没有持久记忆,无法对术语任何合理的定义进行推理,无法分层制定计划。他反对在追寻人类水平智能的过程中依靠先进的大模型,因为大模型只有在正确的训练数据训练后才能正确回答提示,它“本质上是不安全的”。他正致力于开发新一代 AI 系统去实现人类水平的智能,这个过程可能需要十年时间。LeCun 在 Meta 的 Fundamental AI Research (Fair) 实验室有一支 500 人的团队,使用“世界建模(world modelling)”的方法开发新一代 AI,它能发展出常识,以类似人类的方式了解世界如何运作。
记者调查发现,在多个电商、社交平台上,都有论文代写的身影。中介发帖宣传、拉客谈价,写手接单,俨然形成一条完整的灰色产业链,而中介宣称的“老师代写”,毕业生眼里的“专业写手”,不过是深谙降重之道的论文剽窃者,或使用 AI 写作的外行人。一位有经验的写手告诉记者,可以用 AI 写。论文中的数据统计,可以先让AI合理地编一些数据,再让 AI 根据编好的数据,一章节一章节地分析,“一下午就搞定了”,“写一篇论文才挣三五百元,你还真去帮他查数据、找资料,认认真真地写啊。”一位初中学历的写手介绍,他进入代写行业已经 7 年了。刚开始就是找已发表的论文拼凑,然后再使用一些软件或手动改语序、词语进行降重,AI 出现后,主要靠 AI 辅助完成论文。
AI 研究员 Chris Olah 过去十年沉迷于研究人工神经网络。他先后任职于 Google Brain 和 OpenAI,目前在他联合创办的 AI 创业公司 Anthropic 工作。他一直对 AI 内部如何工作十分感兴趣。随着生成式 AI 无处不在,AI 黑箱问题日益引人关注。大模型会随意捏造信息,如果我们能了解其内部如何工作,那么将有助于让它变得更安全。Olah 相信我们正实现这一目标。他的团队正通过对大模型逆向工程去了解它们为什么会产生特定输出。根据今天发表的论文,他们已经取得了显著进展。研究人员称,他们的做法是将人工神经元视为字母,字母本身没什么意义,只有按顺序组合起来才有意义。C 没有意义,但 Car 有。他们使用了被称为字典学习的技术去解释神经网络。
微软在 Surface 活动上演示了 MS 画图应用的新 AI 文本生成图像功能。新的 AI 工具被称为 Cocreator,可以根据用户输入的文本或涂鸦生成图像。Cocreator 提供了一个“创意滑块”,允许用户控制与原作相比你希望 AI 能接管的程度。微软称,结合文本提示和画笔描边,将能实现更快的图像编辑。它比只使用 DALL-E 或其它文本到图像生成模型能实现更精确的渲染。
微软的升级版 AI 助手 Copilot 将会记住你在新 AI PC 上的一举一动,它称该功能为 Windows Recall,AI 助手能以一种类似照相记忆的方式访问用户在 PC 上看到的内容或做的工作。微软承诺将给予用户隐私保护,将向用户提供选项过滤掉不希望被跟踪的内容。微软合作伙伴宏碁、华硕、戴尔、惠普、联想和三星将于 6 月 18 日推出新的 AI 增强 Windows PC。
斯嘉丽·约翰逊(Scarlett Johansson) 的律师要求 OpenAI 披露其如何开发 AI 语音 Sky 所用的声音的。Sky 的声音与斯嘉丽极其相似,OpenAI 已将 Sky 下架,但声称 Sky 的声音来自于另一名女演员,为了保护其隐私而不公开其姓名。斯嘉丽在声明中表示,OpenAI 早在去年秋天就联络过她,但她在认真考虑之后拒绝了;在 GPT-4o 发布前两天 OpenAI 再次联络了其经纪人,请求重新考虑授权使用其声音。当 OpenAI 发布会公开 Sky 时,斯嘉丽感到了背叛,认为 OpenAI 未经许可克隆了她的声音,她表示感到了震惊、愤怒和难以置信,认为这是一种人身侮辱。
2023 年 5 月,OpenAI 创始人 Sam Altman 在美国参议院司法委员会大谈监管 AI,当时 OpenAI 的 AI 聊天机器人 ChatGPT 成为历史上增长最快的消费者产品,每周有 1 亿用户使用。Altman 等 AI 公司高管呼吁监管有几分类似 16 世纪英国对印刷行业的监管,英女王伊丽莎白一世将印刷的许可权授权给特定印刷行会成员,但她的监管尝试没有成功。一部分人支持监管是出于道德理由,另一部分则是出于利益。Altman 支持监管更可能是后者,是为了抵御竞争对手,推动裙带资本主义的形成,微软以及 Google 都响应了这一监管呼吁。生成式 AI 的繁荣将是会更多让科技巨头们受益,而不是惠及普通消费者。
Geoffrey Hinton 教授被誉为 AI 教父,他表示如果 AI 取代了更多人类的工作,为了消除其不公平的影响,政府应该推行全民基本收入(UBI 或 universal basic income)。他说,虽然 AI 能提高生产力和增加财富,但它带来的财富主要流向富人,而不是失去工作的人,这对社会会产生糟糕的影响。Hinton 教授是神经网络的先行者,而神经网络是 AI 的基础。他曾在 Google 工作,去年离职,表示可以更自由的谈论不受监管的 AI 所带来的危险。他建议禁止将 AI 用于军事,认为会对人类带来灭绝级威胁。
美国海军陆战队特种作战司令部 (MARSOC) 正在评估 Ghost Robotics 研发的新一代机器狗,它可以配备 AI 辅助瞄准的武器。Ghost Robotics 的四轮无人车 Q-UGV 可用于侦察和监视,也可以装备武器用于远程交战。Onyx Industries 称 MARSOC 正在测试两辆装备了其 SENTRY 远程武器系统的 Q-UGV,它的 SENTRY 系统有支持 AI 的数字成像系统,能自动探测和跟踪人员、无人机或车辆,向位于世界任何地方的远程操作人员报告潜在目标。该系统不能决定自动开火,开火的决策仍然由人类控制。MARSOC 发表声明表示,测试装备武器的无人车并不意味着它对此类能力感兴趣。
Mozilla Firefox 加入了对英伟达的 RTX Video AI 视频分辨率增强技术的支持。RTX Video 由两部分组成。RTX 视频超分辨率可提升低分辨率视频的分辨率,以获得更加清晰锐利的图像。其工作原理是对低分辨率视频进行分析,然后通过深度学习来推测更高分辨率的版本应该是什么样子。然后,该算法会将推测出来的图像与传统的上采样版本相结合,以减少或消除压缩伪影并锐化最终输出的图像。RTX Video HDR 则会更进一步:启用后,它会通过 AI 神经网络分析标准动态范围 (SDR) 下的视频内容,以便添加高动态范围 (HDR10) 信息,进而增强视觉效果,并使视频更加精细、生动。使用该技术需要英伟达显卡以及兼容 HDR10 的显示器或电视。
全国首例 AI 视听作品侵权案”于 5 月 15 日下午在北京互联网法院进行一审庭前谈话。原告陈坤使用 GPT4 和 Midjourney 等软件制作了基于《山海经》的《山海奇镜》预告片。2024 年 1 月 18 日 ,陈坤发现抖音账户名为“文刻创作”的账号,未经他的许可完全复制使用了他创作的《山海奇镜》预告片的文案、配音、音乐。他提起了侵权诉讼,请求判令被告赔偿原告经济损失及合理支出 50 万元。被告方表示该作品发布后并未有任何盈利行为,且在得知涉嫌侵权后已即时删除该视频。被告不接受索赔 50 万元的要求。