奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: 校长被 AI 生成的种族主义言论陷害

Wilson(42865)

发表于2024年04月28日 20时46分星期日
来自少数派报告

Pikesville High School 前体育指导员 Dazhon Darien 周四被捕，被控多项罪名，其中之一是伪造了校长 Eric Eiswert 的声音，在社交媒体上发布了种族主义言论，导致了校长被停职。警方称，Darien 制作 AI 语音是为了报复校长，因为校长已对学校资金可能被不正确处理发起调查。他制作的语音模拟校长的声音贬低了黑人学生和犹太社区，该语音在社交媒体上广泛传播。校长被停职，社交媒体传播着一波又一波仇恨信息，学校收到了大量电话。Darien 被捕时正准备飞往休斯顿，他随身携带了武器。

科技: 如果 PC 未达到支持 AI 的硬件标准 Windows 11 将显示水印

Wilson(42865)

发表于2024年04月27日 23时23分星期六
来自月光狂想曲

Windows 11 的一个预览版本 Insider Build 26200 被发现包含了一个 AI 硬件规格检测工具 AI Explorer。如果你的 PC 硬件未达到标准，它将显示水印形式的警告。目前的 AI Explorer 针对的是 Windows 11 的 ARM64 版本，要求系统配备 NPU 以及 16 GB 内存和 225 GB 系统存储空间。x86 版本目前所知的是 Windows 11 24H2 强制性要求 CPU 必须支持 SSE4.2 指令集，而今天几乎所有 x86 CPU 都支持该指令集。

科技: 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B

Wilson(42865)

发表于2024年04月26日 23时21分星期五
来自猛兽的财富

阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称，Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美，在 Chat 评估中表现出色，包括 MT-Bench 和 AlpacaEval 2.0。Qwen1.5-110B 与其他 Qwen1.5 模型相似，采用了相同的Transformer 解码器架构。它包含了分组查询注意力（GQA），在模型推理时更加高效。该模型支持 32K tokens 的上下文长度，同时它仍然是多语言的，支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

科技: Adobe 新 AI 模型能让模糊视频变成高清视频

Wilson(42865)

发表于2024年04月25日 23时57分星期四
来自大魔法师

Adobe 研究人员发表了一篇预印本论文，介绍了一种新的生成式 AI 模型 VideoGigaGAN，它能让将视频分辨率提升到原始分辨率的八倍。研究人员称 VideoGigaGAN 优于其它视频超分辨率(Video Super Resolution 或 VSR)重建方法，能提供更细粒度的细节，不会引入任何 AI 制造的幻影。现有的 VSR 方法如 GAN（Generative Adversarial Networks）能有效提升静态图像的分辨率，但提升视频的分辨率则容易引入闪烁或伪影；其它 VSR 方法能避免这些问题，但清晰度或细节不够。VideoGigaGAN 能综合现有方法的长处，有更高的图像/视频质量，同时能减少闪烁或失真问题。

科技: 苹果发布可在本地运行的开放模型 OpenELM

Wilson(42865)

发表于2024年04月25日 17时50分星期四
来自火星战士

苹果发布了它的开放模型 OpenELM，可以在本地设备而不是云端运行。OpenELM 的权重、训练的不同检查点（checkpoints）、预训练评估微调等的指南都公布在 Hugging Face 平台上。示例代码许可并不禁止商业使用或修改，只是要求在重新发布时包含苹果完整且没有修改过的声明。OpenELM 由一组旨在高效执行文本生成任务的小模型组成，共八个模型，四个预训练四个指令微调，参数规模从 2.7 亿到 30 亿。

科技: 微软发布其轻量级模型 Phi-3

Wilson(42865)

发表于2024年04月24日 00时01分星期三
来自月缘

微软发布了其轻量级模型 Phi-3，其中最小版本 Phi-3 Mini 的权重已发布在 Hugging Face 上。Phi-3 有三个版本：Phi-3 Mini 有 38 亿参数，未来计划发布的 Phi-3 Small 有 70 亿参数，Phi-3 Medium 有 140 亿参数。微软高管称 Phi-3 Mini 的性能与 GPT-3.5 接近，但参数规模要小得多。相比参数规模更大的模型，小模型运行开销更低，在个人设备如手机和笔记本上表现更好。

科技: AI 需要大量的电以至于科技公司进入了能源行业

Wilson(42865)

发表于2024年04月23日 15时22分星期二
来自开普罗纳的魔法师

AI 需要消耗大量的电，以至于为满足电力需求科技公司进入了能源行业。OpenAI CEO Sam Altman 最近投资了用太阳能为数据中心供电的公司 Exowatt，OpenAI 的合作伙伴微软正寻求获得核能批准，以帮助运营 AI 服务。去年 AI 公司 Anthropic 的主要投资者亚马逊表示投资了逾 100 个可再生能源项目，使其“连续第四年成为全球最大的可再生能源企业买家”。

科技: Linus Torvalds 谈 AI 炒作

Wilson(42865)

发表于2024年04月20日 22时56分星期六
来自人类向何处去

Linus Torvalds 与 Verizon Open Source Program Office 负责人 Dirk Hohndel 谈论了近期火热无比的 AI。Torvalds 讽刺的说，“看起来很搞笑！也许我会被 AI 模型取代！”Hohndel 认为今天的 AI 只是一种更强大的自动修正工具。Torvalds 认为需要再等十年才能知道 AI 会走向何处。Torvalds 已经注意到 AI 狂热对内核的影响——作为 AI 热的最大受益者英伟达公司，其开发者与内核开发者之间的沟通更频繁，该公司正在改进内核的内存管理，因为它需要 Linux 更高效的运行 AI 大模型。Torvalds 对 AI 产生的错误信息表达了谨慎，Hohndel 开玩笑的说这是美丽科学，“美丽科学进，美丽科学出。”

科技: 微软的 VASA-1 模型根据一张照片和一条音轨生成该人的说话视频

Wilson(42865)

发表于2024年04月19日 23时57分星期五
来自方舟

微软亚洲研究院发布了 VASA-1 模型，该模型能根据一个人的一张照片和一条音轨生成其说话或唱歌的同步动画视频。VASA 代表 Visual Affective Skills Animator，它使用了机器学习分析静态图像和音频片段，然后生成有精确面部表情、头部运动以及与音频口型同步的逼真视频。微软声称该模型在真实性、表现力和效率方面显著优于以前的语音动画方法。微软研究员使用了 VoxCeleb2 数据集训练了 VASA-1。该数据集包含了 6112 位名人的逾 100 万条话语，提取自上传到 YouTube 的视频。VASA-1 能以每秒最高 40 帧的速度生成 512x512 像素分辨率的视频，它潜在可用于深度伪造，研究人员没有公开模型源代码。

科技: 美国测试 AI 驾驶战斗机与人类飞行员缠斗

Wilson(42865)

发表于2024年04月19日 17时04分星期五
来自来自12个星球的敌人

美国空军试飞院和 DARPA 宣称在机器学习上取得突破，它演示了 AI 软件控制的 F-16 战斗机能与人类飞行员展开近距离缠斗。演示是基于 X-62A VISTA，该试验机是修改版的 F-16 战斗机，集成了飞行模拟器，能让 AI 或者称为机器学习代理（ML-Agents）控制飞机。AI 首次驾驶 X-62A 是在 2022 年 12 月，2023 年 9 月 AI 驾驶的 X-62A 与人类驾驶的 F-16 进行了模拟空战。DARPA 认为，X-62A 团队的成就将被视为类似 AlphaGo Zero 对国际象棋、将棋和围棋的影响，作为军事和商业应用的自主驾驶验证。

科技: Meta 发布了 80 亿和 300 亿参数版本的 Llama 3

Wilson(42865)

发表于2024年04月19日 14时06分星期五
来自火星大师

Meta 发布了 80 亿和 300 亿参数版本的 Llama 3 模型，有 4050 亿参数的版本还在训练之中，将在未来几个月发布，将支持多模和多种语言间的交流，以及更长的上下文窗口。Llama 3 是开放模型，源代码和权重托管在 GitHub 和 Hugging Face 上。Meta 还开放了它的 AI 聊天服务 Meta AI，类似 OpenAI 的 ChatGPT，访问 Meta.ai 也无需注册，但如果要保留聊天记录需要登陆。Meta AI 支持美国、澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦等国家和地区的用户访问，可能因为欧盟的法律限制该服务目前不对欧盟用户开放。

科技: 印度总理称 AI 帮助制定了国家 25 年计划

Wilson(42865)

发表于2024年04月18日 22时20分星期四
来自彩虹尽头

印度总理莫迪(Narendra Modi)接受该国亚洲国际新闻社（ANI）采访时表示利用 AI 制定了 25 年发展蓝图。他的团队收集了 150 万人的意见，然后用 AI 精炼和分类。莫迪正寻求连任，竞选第三个总理任期，预计会轻松获胜。他没有透露发展路线图的细节，表示会在大选之后实施。他领导的印度人民党周二公布了竞选宣言，承诺利用 AI 打击非法毒品贸易，改善交通管理。其中包括投资 12.4 亿美元支持 AI 发展，构建基础设施，建造至少有 1 万个 GPU 的超算，以及推动构建本土大模型，等等。

科技: 研究者澄清弱智吧语料训练效果最佳论

Wilson(42865)

发表于2024年04月18日 18时56分星期四
来自总门谷

中科院深圳先进技术研究院、北大、中科大以及零一万物等学术机构和企业的研究人员最近推出了 COIG-CQIA 中文高质量指令微调数据集，旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。他们的测试发现弱智吧的语料表现最出色。论文主要作者、深圳先进技术研究院研究生白岳霖澄清，他们只使用了弱智吧的标题，没有使用用户评论，“因为我们的目标是构建符合大模型指令微调质量需求的数据，而贴吧中网友的评论通常不适合直接作为微调数据，因此我们并没有将‘弱智吧’网友的评论纳入我们的数据中。”论文通讯作者、加拿大滑铁卢大学博士生张舸进一步解释：“‘弱智吧’中网友们绞尽脑汁想出来的‘弱智问题’，的确为大模型提供了角度清奇的高质量指令。但是帖子的回答，却有很多冒犯性表述甚至事实性错误，许多回答就是抖机灵、玩梗的，而GPT-4的回答基本上都‘很正经’，经过人工筛选基本上能得到较为可靠的回答。”

科技: Mistral 宣布最新开放大模型 Mixtral 8x22B

Wilson(42865)

发表于2024年04月18日 00时18分星期四
来自通灵师

法国 AI 创业公司 Mistral 宣布了其最新的开放大模型 Mixtral 8x22B，公布的测试显示它是目前最先进的开放模型。Mistral 称 8x22B 是真正开放的模型，使用 Apache 2.0 许可证，允许任何人不受限制的使用。它是一种稀疏 Mixture-of-Experts (SMoE)模型，有 1410 亿参数，但活跃参数仅为 390 亿，在其规模下提供了无与伦比的成本效率。Mixtral 8x22B 的优点包括：精通英语、法语、意大利语、德语和西班牙语，具有强大的数学和编码能力，原生能函数调用，64K 令牌上下文窗口。

科技: 微软亚洲研究院开源然后移除了新 AI 模型

Wilson(42865)

发表于2024年04月17日 13时54分星期三
来自一九八四

微软亚洲研究院的中国研究人员周二发布了一个新的 AI 模型 WizardLM-2-7B，权重发布在 Hugging Face 平台上。但几小时后微软就将其从平台上移除。研究人员解释说，原因是他们意外错过了微软发布新模型前要求进行的安全测试步骤。一位知情人士表示，微软的 AI 政策要求，在发布任何 AI 模型前，必须首先获得公司委员会 Deployment Safety Board 的批准，该委员会将测试模型是否能执行有害任务，如生成暴力或令人不安的内容。WizardLM-2-7B 模型能完成文本生成、代码建议、翻译不同语言，或解决数学问题等任务。

科技: 李彦宏声称开源大模型更昂贵

Wilson(42865)

发表于2024年04月16日 21时13分星期二
来自人猿泰山之挚友金狮

今天流行的开源大模型主要由 Meta 和 Google 之类的巨头发布，而 OpenAI 等则转向了闭源，此外中国很多 AI 公司的大模型是在 Meta 的 Llama 开源模型基础上开发的。在深圳举行的 Create 2024 百度 AI 开发者大会上，百度 CEO 李彦宏站在了 OpenAI 闭源这边。他认为，开发者通过文心 4.0 降维裁剪出来的更小尺寸模型，要比直接拿开源模型调出来的模型，同等尺寸下效果明显更好；同等效果下，成本明显更低。“大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以开源模型会越来越落后。”但开源模型一直在发展中，并非停滞不前。

科技: AI 生成奥特曼案被判侵权

Wilson(42865)

发表于2024年04月16日 14时49分星期二
来自巨石苍穹

奥特曼系列版权所有者日本圆谷制作披露，中国法院审判了一起与 AI 生成奥特曼相关的版权诉讼，判处被告侵权。去年中国运营商的网络服务中发现了酷似奥特曼的由生成式 AI 制作的图像。奥特曼中国代理商认为这是未经许可让 AI 学习版权作品后生成的图像，要求相关运营商停止服务及赔偿损失，并于今年 1 月提起了诉讼。广州互联网法院 2 月 8 日认定被告侵犯著作权。要求被告赔偿损失人民币 1 万元和防止图像生成的再度发生。

科技: 斯坦福报告称 AI 算力投资急剧上升

Wilson(42865)

发表于2024年04月16日 14时39分星期二
来自最后一个阿特兰蒂斯人

斯坦福公布了 2024 年 AI 指数报告：AI 在图像分类、视觉推理和英语理解等方面打败了人类，但在竞赛数学、视觉常识推理和规划等更复杂任务上不如人类；2023 年科技行业的企业发布了 53 个值得注意的机器学习模型，学界只发布了 15 个，学界和业界合作发布了 21 个；OpenAI 的 GPT-4 模型训练费用预计为 7800 万美元，而 Google Gemini Ultra 模型的计算成本约为 1.91 亿美元，先进模型的算力投资急剧上升；美国是先进 AI 模型的主要来源国，2023 年美国发布了 61 个先进的大模型，而欧盟是 21 个，中国是 15 个；美国的 AI 相关监管法规在 2023 年有 25 个，而在 2016 年只有 1 个；Ipsos 的调查显示认为 AI 在 3-5 年内显著影响生活的人的比例比 60% 上升到 66%，皮尤的数据显示 52% 的美国人表示对 AI 更感到担忧而不是兴奋，

科技: Medium 禁止其付费服务使用 AI 生成内容

Wilson(42865)

发表于2024年04月15日 23时53分星期一
来自诺比与错乱的时间线

Medium 通知用户，其付费服务 Partner 禁止使用 AI 生成完整内容。新政策于 2024 年 5 月 1 日生效。完全用 AI 生成的故事将从付费墙内移除，可能会导致用户被踢出付费服务。Medium 强调，它是为了人讲故事，不希望平台上出现完全由 AI 生成的故事。Medium 表示它理解用 AI 有助于更清晰的写作，或者有助于非母语者写作，但不允许完全用 AI 生成内容。Medium 允许负责任的用 AI 帮助写作，但要求用户公开透明，在文章前两段声明使用了 AI。

科技: AI 产品仍然依靠人类去填补性能差距

Wilson(42865)

发表于2024年04月14日 23时07分星期日
来自沉船岛

最近的新闻清晰表明，如果 AI 在一项人类任务中表现出色，那么很有可能该任务实际上就是人类做的。今年初，乔治卡林（George Carlin）遗产执行机构起诉了声称使用 AI 制作了乔治卡林风格节目的播客，该播客之后披露节目剧本事实上是名叫 Chad 的人类完成的。双方之后达成了和解。一家为汽车餐厅提供 AI 语音界面的公司在没有人工帮助下只能完成三成工作。亚马逊新商店放弃了 Just Walk Out 自动结账系统，原因是该系统事实上需要人类进行验证。如果我们的记忆不是三秒钟的话，同样的事情几年前就发生过：2015 年 AI 聊天机器人就很热门。一家创业公司 x.ai 称其 AI 助手能阅读邮件安排会议，一家叫 GoButler 的公司可以帮助预订航班或订购薯条。这些所谓的 AI 助手都需要人工。人类躲在机器人后面，确保它不会犯错误或胡说八道。