文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
Pikesville High School 前体育指导员 Dazhon Darien 周四被捕,被控多项罪名,其中之一是伪造了校长 Eric Eiswert 的声音,在社交媒体上发布了种族主义言论,导致了校长被停职。警方称,Darien 制作 AI 语音是为了报复校长,因为校长已对学校资金可能被不正确处理发起调查。他制作的语音模拟校长的声音贬低了黑人学生和犹太社区,该语音在社交媒体上广泛传播。校长被停职,社交媒体传播着一波又一波仇恨信息,学校收到了大量电话。Darien 被捕时正准备飞往休斯顿,他随身携带了武器。
Windows 11 的一个预览版本 Insider Build 26200 被发现包含了一个 AI 硬件规格检测工具 AI Explorer。如果你的 PC 硬件未达到标准,它将显示水印形式的警告。目前的 AI Explorer 针对的是 Windows 11 的 ARM64 版本,要求系统配备 NPU 以及 16 GB 内存和 225 GB 系统存储空间。x86 版本目前所知的是 Windows 11 24H2 强制性要求 CPU 必须支持 SSE4.2 指令集,而今天几乎所有 x86 CPU 都支持该指令集。
阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
Adobe 研究人员发表了一篇预印本论文,介绍了一种新的生成式 AI 模型 VideoGigaGAN,它能让将视频分辨率提升到原始分辨率的八倍。研究人员称 VideoGigaGAN 优于其它视频超分辨率(Video Super Resolution 或 VSR)重建方法,能提供更细粒度的细节,不会引入任何 AI 制造的幻影。现有的 VSR 方法如 GAN(Generative Adversarial Networks)能有效提升静态图像的分辨率,但提升视频的分辨率则容易引入闪烁或伪影;其它 VSR 方法能避免这些问题,但清晰度或细节不够。VideoGigaGAN 能综合现有方法的长处,有更高的图像/视频质量,同时能减少闪烁或失真问题。
苹果发布了它的开放模型 OpenELM,可以在本地设备而不是云端运行。OpenELM 的权重、训练的不同检查点(checkpoints)、预训练评估微调等的指南都公布在 Hugging Face 平台上。示例代码许可并不禁止商业使用或修改,只是要求在重新发布时包含苹果完整且没有修改过的声明。OpenELM 由一组旨在高效执行文本生成任务的小模型组成,共八个模型,四个预训练四个指令微调,参数规模从 2.7 亿到 30 亿。
微软发布了其轻量级模型 Phi-3,其中最小版本 Phi-3 Mini 的权重已发布在 Hugging Face 上。Phi-3 有三个版本:Phi-3 Mini 有 38 亿参数,未来计划发布的 Phi-3 Small 有 70 亿参数,Phi-3 Medium 有 140 亿参数。微软高管称 Phi-3 Mini 的性能与 GPT-3.5 接近,但参数规模要小得多。相比参数规模更大的模型,小模型运行开销更低,在个人设备如手机和笔记本上表现更好。
AI 需要消耗大量的电,以至于为满足电力需求科技公司进入了能源行业。OpenAI CEO Sam Altman 最近投资了用太阳能为数据中心供电的公司 Exowatt,OpenAI 的合作伙伴微软正寻求获得核能批准,以帮助运营 AI 服务。去年 AI 公司 Anthropic 的主要投资者亚马逊表示投资了逾 100 个可再生能源项目,使其“连续第四年成为全球最大的可再生能源企业买家”。
Linus Torvalds 与 Verizon Open Source Program Office 负责人 Dirk Hohndel 谈论了近期火热无比的 AI。Torvalds 讽刺的说,“看起来很搞笑!也许我会被 AI 模型取代!”Hohndel 认为今天的 AI 只是一种更强大的自动修正工具。Torvalds 认为需要再等十年才能知道 AI 会走向何处。Torvalds 已经注意到 AI 狂热对内核的影响——作为 AI 热的最大受益者英伟达公司,其开发者与内核开发者之间的沟通更频繁,该公司正在改进内核的内存管理,因为它需要 Linux 更高效的运行 AI 大模型。Torvalds 对 AI 产生的错误信息表达了谨慎,Hohndel 开玩笑的说这是美丽科学,“美丽科学进,美丽科学出。”
微软亚洲研究院发布了 VASA-1 模型,该模型能根据一个人的一张照片和一条音轨生成其说话或唱歌的同步动画视频。VASA 代表 Visual Affective Skills Animator,它使用了机器学习分析静态图像和音频片段,然后生成有精确面部表情、头部运动以及与音频口型同步的逼真视频。微软声称该模型在真实性、表现力和效率方面显著优于以前的语音动画方法。微软研究员使用了 VoxCeleb2 数据集训练了 VASA-1。该数据集包含了 6112 位名人的逾 100 万条话语,提取自上传到 YouTube 的视频。VASA-1 能以每秒最高 40 帧的速度生成 512x512 像素分辨率的视频,它潜在可用于深度伪造,研究人员没有公开模型源代码。
美国空军试飞院和 DARPA 宣称在机器学习上取得突破,它演示了 AI 软件控制的 F-16 战斗机能与人类飞行员展开近距离缠斗。演示是基于 X-62A VISTA,该试验机是修改版的 F-16 战斗机,集成了飞行模拟器,能让 AI 或者称为机器学习代理(ML-Agents)控制飞机。AI 首次驾驶 X-62A 是在 2022 年 12 月,2023 年 9 月 AI 驾驶的 X-62A 与人类驾驶的 F-16 进行了模拟空战。DARPA 认为,X-62A 团队的成就将被视为类似 AlphaGo Zero 对国际象棋、将棋和围棋的影响,作为军事和商业应用的自主驾驶验证。
Meta 发布了 80 亿和 300 亿参数版本的 Llama 3 模型,有 4050 亿参数的版本还在训练之中,将在未来几个月发布,将支持多模和多种语言间的交流,以及更长的上下文窗口。Llama 3 是开放模型,源代码和权重托管在 GitHub 和 Hugging Face 上。Meta 还开放了它的 AI 聊天服务 Meta AI,类似 OpenAI 的 ChatGPT,访问 Meta.ai 也无需注册,但如果要保留聊天记录需要登陆。Meta AI 支持美国、澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦等国家和地区的用户访问,可能因为欧盟的法律限制该服务目前不对欧盟用户开放。
印度总理莫迪(Narendra Modi)接受该国亚洲国际新闻社(ANI)采访时表示利用 AI 制定了 25 年发展蓝图。他的团队收集了 150 万人的意见,然后用 AI 精炼和分类。莫迪正寻求连任,竞选第三个总理任期,预计会轻松获胜。他没有透露发展路线图的细节,表示会在大选之后实施。他领导的印度人民党周二公布了竞选宣言,承诺利用 AI 打击非法毒品贸易,改善交通管理。其中包括投资 12.4 亿美元支持 AI 发展,构建基础设施,建造至少有 1 万个 GPU 的超算,以及推动构建本土大模型,等等。
中科院深圳先进技术研究院、北大、中科大以及零一万物等学术机构和企业的研究人员最近推出了 COIG-CQIA 中文高质量指令微调数据集,旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。他们的测试发现弱智吧的语料表现最出色。论文主要作者、深圳先进技术研究院研究生白岳霖澄清,他们只使用了弱智吧的标题,没有使用用户评论,“因为我们的目标是构建符合大模型指令微调质量需求的数据,而贴吧中网友的评论通常不适合直接作为微调数据,因此我们并没有将‘弱智吧’网友的评论纳入我们的数据中。”论文通讯作者、加拿大滑铁卢大学博士生张舸进一步解释:“‘弱智吧’中网友们绞尽脑汁想出来的‘弱智问题’,的确为大模型提供了角度清奇的高质量指令。但是帖子的回答,却有很多冒犯性表述甚至事实性错误,许多回答就是抖机灵、玩梗的,而GPT-4的回答基本上都‘很正经’,经过人工筛选基本上能得到较为可靠的回答。”
法国 AI 创业公司 Mistral 宣布了其最新的开放大模型 Mixtral 8x22B,公布的测试显示它是目前最先进的开放模型。Mistral 称 8x22B 是真正开放的模型,使用 Apache 2.0 许可证,允许任何人不受限制的使用。它是一种稀疏 Mixture-of-Experts (SMoE)模型,有 1410 亿参数,但活跃参数仅为 390 亿,在其规模下提供了无与伦比的成本效率。Mixtral 8x22B 的优点包括:精通英语、法语、意大利语、德语和西班牙语,具有强大的数学和编码能力,原生能函数调用,64K 令牌上下文窗口。
微软亚洲研究院的中国研究人员周二发布了一个新的 AI 模型 WizardLM-2-7B,权重发布在 Hugging Face 平台上。但几小时后微软就将其从平台上移除。研究人员解释说,原因是他们意外错过了微软发布新模型前要求进行的安全测试步骤。一位知情人士表示,微软的 AI 政策要求,在发布任何 AI 模型前,必须首先获得公司委员会 Deployment Safety Board 的批准,该委员会将测试模型是否能执行有害任务,如生成暴力或令人不安的内容。WizardLM-2-7B 模型能完成文本生成、代码建议、翻译不同语言,或解决数学问题等任务。
今天流行的开源大模型主要由 Meta 和 Google 之类的巨头发布,而 OpenAI 等则转向了闭源,此外中国很多 AI 公司的大模型是在 Meta 的 Llama 开源模型基础上开发的。在深圳举行的 Create 2024 百度 AI 开发者大会上,百度 CEO 李彦宏站在了 OpenAI 闭源这边。他认为,开发者通过文心 4.0 降维裁剪出来的更小尺寸模型,要比直接拿开源模型调出来的模型,同等尺寸下效果明显更好;同等效果下,成本明显更低。“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”但开源模型一直在发展中,并非停滞不前。
奥特曼系列版权所有者日本圆谷制作披露,中国法院审判了一起与 AI 生成奥特曼相关的版权诉讼,判处被告侵权。去年中国运营商的网络服务中发现了酷似奥特曼的由生成式 AI 制作的图像。奥特曼中国代理商认为这是未经许可让 AI 学习版权作品后生成的图像,要求相关运营商停止服务及赔偿损失,并于今年 1 月提起了诉讼。广州互联网法院 2 月 8 日认定被告侵犯著作权。要求被告赔偿损失人民币 1 万元和防止图像生成的再度发生。
斯坦福公布了 2024 年 AI 指数报告:AI 在图像分类、视觉推理和英语理解等方面打败了人类,但在竞赛数学、视觉常识推理和规划等更复杂任务上不如人类;2023 年科技行业的企业发布了 53 个值得注意的机器学习模型,学界只发布了 15 个,学界和业界合作发布了 21 个;OpenAI 的 GPT-4 模型训练费用预计为 7800 万美元,而 Google Gemini Ultra 模型的计算成本约为 1.91 亿美元,先进模型的算力投资急剧上升;美国是先进 AI 模型的主要来源国,2023 年美国发布了 61 个先进的大模型,而欧盟是 21 个,中国是 15 个;美国的 AI 相关监管法规在 2023 年有 25 个,而在 2016 年只有 1 个;Ipsos 的调查显示认为 AI 在 3-5 年内显著影响生活的人的比例比 60% 上升到 66%,皮尤的数据显示 52% 的美国人表示对 AI 更感到担忧而不是兴奋,
Medium 通知用户,其付费服务 Partner 禁止使用 AI 生成完整内容。新政策于 2024 年 5 月 1 日生效。完全用 AI 生成的故事将从付费墙内移除,可能会导致用户被踢出付费服务。Medium 强调,它是为了人讲故事,不希望平台上出现完全由 AI 生成的故事。Medium 表示它理解用 AI 有助于更清晰的写作,或者有助于非母语者写作,但不允许完全用 AI 生成内容。Medium 允许负责任的用 AI 帮助写作,但要求用户公开透明,在文章前两段声明使用了 AI。
最近的新闻清晰表明,如果 AI 在一项人类任务中表现出色,那么很有可能该任务实际上就是人类做的。今年初,乔治卡林(George Carlin)遗产执行机构起诉了声称使用 AI 制作了乔治卡林风格节目的播客,该播客之后披露节目剧本事实上是名叫 Chad 的人类完成的。双方之后达成了和解。一家为汽车餐厅提供 AI 语音界面的公司在没有人工帮助下只能完成三成工作。亚马逊新商店放弃了 Just Walk Out 自动结账系统,原因是该系统事实上需要人类进行验证。如果我们的记忆不是三秒钟的话,同样的事情几年前就发生过:2015 年 AI 聊天机器人就很热门。一家创业公司 x.ai 称其 AI 助手能阅读邮件安排会议,一家叫 GoButler 的公司可以帮助预订航班或订购薯条。这些所谓的 AI 助手都需要人工。人类躲在机器人后面,确保它不会犯错误或胡说八道。