文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
Adobe 正以每分钟约 3 美元的价格购买视频构建文本视频生成模型,试图赶上 OpenAI 的 Sora。Adobe 要求摄影师和艺术家递交表现人们日常活动的视频,比如步行,或者表达情绪如快乐和生气。 Adobe 要求提供逾百种人物动作和表现情感的短片,以及脚、手或眼睛的简单解剖片段。它不希望视频包含版权材料,裸体或其它冒犯性内容。视频的平均费用约为每分钟 2.62 美元,最高每分钟 7.25 美元。
检测抄袭的 Turnitin 公司公布的数据显示,去年学生递交了使用生成式 AI 撰写的逾 2200 万篇论文。Turnitin 在一年前发布了 AI 写作检测工具,至今它检测了逾 2 亿篇论文,这些论文绝大多数是由高中生和大学生撰写的。结果发现,11% 的论文其中五分之一的内容可能是 AI 帮助撰写的,3% 的论文八成或以上的内容是 AI 帮助撰写的。ChatGPT 的推出引发了英语课作文可能消亡的担忧,生成式 AI 可以在短时间内生成大量内容,但因为所谓的“幻觉”这些信息未必正确。Turnitin 的 AI 写作检测工具已经更新,能检测 Grammarly 等服务帮助美化的文章。
知名 AI 专家吴恩达(Andrew Ng)本周加入了亚马逊的董事会,这一时机恰逢科技巨头们在生成式 AI 领域展开激烈竞争。亚马逊云服务面临微软将 OpenAI 的 AI 技术整合到云服务 Azure 的压力,它的 Alexa 语音助手面临 OpenAI 的 ChatGPT 和 Google 的生成式 AI 聊天机器人的竞争。吴恩达此前领导了 Google 和百度的 AI 项目,他目前是斯坦福大学的客座教授,经营着自己的 AI 风险工作室和学习公司。
Meta 新一代大模型 Llama 3 预计将在今年夏天推出,类似 Google 的大模型 Gemini,Llama 3 也将有不同参数规模的版本,而夏天发布的将是最大参数规模的版本,而较小参数规模的版本预计将在下周发布。Llama 3 大版本将支持多模,能理解并生成文本和图像,Meta 希望它能赶上 OpenAI 的 GPT-4。但计划在下周发布的两款小版本不支持多模。
英特尔宣布了 AI 加速器 Gaudi 3,相关产品将在第三季度上市。Gaudi 3 使用 5 纳米工艺制造,芯片巨人可能将其交给了台积电等代工。英特尔在 Meta 的开源大模型 Llama 以及 Falcon 等模型上测试了 Gaudi 3,称其功耗低于英伟达的芯片,能效是英伟达 H100 GPU 的2 倍,运行大模型的速度是其 1.5 倍。Gaudi 3 和 AMD 的 AI 加速器类似都使用了开放标准接口 Open accelerator module (OAM),相比下英伟达使用了私有接口。
Google 宣布了辅助编程用的开放大模型 CodeGemma,模型权重可以在 huggingface 上下载。CodeGemma 是基于 Google 今年 2 月发布的轻量级开放大模型 Gemma,针对 Gemma 的两个不同参数规模的版本 Gemma 2B 和 Gemma 7B 发布了 CodeGemma 2B 和 CodeGemma 7B(有预训练和指令微调两种)。
日本最大的电信公司 NTT 和最大的报纸读卖集团对 AI 可能导致社会秩序崩溃表达担忧,呼吁尽快立法限制生成式 AI。虽然生成式 AI 潜在能提高生产力,但 NTT 和读卖的 AI 声明认为 AI 工具开始损害人类尊严,因为这些工具旨在吸引用户注意力,不考虑道德或准确性。声明称,除非 AI 受到限制,在最糟糕的情况下,民主和社会秩序可能崩溃,导致战争。声明呼吁日本政府立即采取应对措施,包括制定法律保护选举和国家安全免受生成式 AI 滥用的影响。
调研机构 AMRO 公布的报告显示,在亚洲 14 个国家和地区中,被生成式人工智能(AI)取代的就业岗位比例最高的是日本,高达 14.4%。紧随其后的是香港(9.5%)和韩国(9.1%),老挝和越南相反较低,为 1%-2%。原因是日本、香港和韩国的事务性工作比例过高,日本五分之一的工作属于事务性工作,其他国家只有 1-12%。因 AI 有望增加的就业岗位比例最高的是新加坡,达到 26.0%。随后是文莱和马来西亚。
美国在生成式 AI 领域独占鳌头。在 AI 的开发和运用不可或缺的芯片和云基础设施方面,美国主要企业的市场份额占到 7~9 成。美国 2023 年 AI 市场规模为 161 亿美元,是第二名中国的 3 倍。英伟达在数据中心用 GPU 领域拥有 92% 的市场份额,AMD 为 3%。英伟达的强大主要是其软件平台 CUDA,它对 AI 开发者而言是不可或缺的。生成式 AI 聊天机器人 ChatGPT 占到了 72% 的使用率,而 Midjourney 在文本生成图像方面占到了 53% 份额。
最近取得重大突破的大模型主要专注于英语,为了弥补中文的差距,中科院深圳先进技术研究院、北大、中科大以及李开复的零一万物等学术机构和企业的研究人员推出了 COIG-CQIA 中文高质量指令微调数据集,旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。COIG-CQIA 的中文语料来自于知乎高赞回答、豆瓣、小红书和以及百度贴吧如弱智吧高赞贴。研究人员使用该数据集对零一万物的 Yi-34B 模型进行微调,结果发现弱智吧的语料表现最出色。研究人员推测可能与弱智吧的内容风格有关,弱智吧的高赞贴通常具有双关、多义等语言特色,可能有助于改进模型的逻辑推理。
YouTube CEO Neal Mohan 表示,如果 OpenAI 用该平台视频训练了其文本视频生成模型 Sora,将是违反该平台的服务条款。对于 OpenAI 是否使用了 YouTube 视频,他表示并没有第一手资料。他接受彭博社采访时表示,内容创作者将视频上传到 YouTube 是有特定期望的,其中之一是遵守服务条款。关于 OpenAI 使用了什么材料训练其 AI 模型存在很多争论。随着 OpenAI、Google 等公司竞相开发更强大 AI,为获得质量更好的结果它们正寻找尽可能多的内容去训练模型。OpenAI CTO Mira Murati 此前表示不确定 Sora 是否使用来自 YouTube、Facebook 和 Instagram 等平台的用户生成视频进行训练。Mohan 称如果 Google 用 YouTube 视频训练其 AI 模型 Gemini,将会遵守 YouTube 与创作者之间的合同。
AI 创业公司、开源文本图像模型 Stable Diffusion 的开发商 Stability AI 据报道资金耗尽,无法支付训练大模型所需的 GPU 集群费用。截至去年 10 月该公司只剩下 400 万美元的储备金。Stability 从亚马逊 AWS、Google Cloud Platform 和以 GPU 为中心的云运营商 CoreWeave 租用了计算基础设施,每年费用约 9900 万美元。此外工资和运营费用还需要 5400 万美元。而它在 2023 年估计的收入只有 1100 万美元。它拖欠了 AWS、Google 和 CoreWeave 千万美元的账单。Stability AI 的筹款也不成功,英特尔承诺投资 5000 万美元,但已支付的金额只有 2000 万美元。公司 CEO Emad Mostaque 上月底在社交媒体上披露他已经辞职,首席运营官 Shan Shan Wong 和首席技术官 Christian Laforte 担任临时的联席 CEO。
OpenAI 宣布其 AI 聊天机器人 ChatGPT 将对所有用户开放,无需登录就可以使用。代价是匿名用户的所有聊天纪录将会进入 OpenAI 的训练数据库,注册用户则可以选择退出。该功能将逐步推送给所有地区的用户,因此可能会有部分地区的用户仍然需要登陆才能使用。免费用户只能使用 GPT-3.5 模型,使用 OpenAI 最新的 ChatGPT 4 模型仍然需要付费订阅。
大模型如 LLaMA 通常需要高端 GPU 才能流畅运行。Mozilla 支持的 llamafile 项目旨在本地运行大模型。开发者刚刚为 llamafile 编写了 84 个新的矩阵乘法内核,显著改进了 CPU 运行性能,让普通 CPU 流畅运行大模型成为可能。ARMv8.2+(如 Raspberry Pi 5) 、英特尔 CPU 以及支持 AVX512 指令集的 AMD Zen 4 CPU 上的运行速度增幅最为突出。
AI 生成内容正在污染我们的文化。以科学为例,在 OpenAI 的 GPT-4 发布之后,科学研究的语言开始发生变异,尤其是在 AI 领域。AI 相关论文同行评语使用的形容词如 “Innovative”、“notable”、“commendable”、“intricate”、“versatile”和“meticulous”的频率在 2024 年大幅增加。此类的修辞是 ChatGPT 等大模型喜欢用的,换句话说,有大量 AI 研究人员将同行的论文丢给 AI 去进行评审,或者至少是在 AI 的帮助下写评语。越接近递交评论的截止日期,AI 使用的频率就越高。AI 审查使用 AI 生成的论文,那么一篇包含有巨大生殖器的小鼠解剖图的论文能通过同行评审发表也就不足为奇了。科学领域只是生成式 AI 对整个社会影响的一个缩影。在 X/Twitter 上,任何病毒式传播的帖子几乎都肯定包含 AI 的回复,Instagram 上有大量 AI 生成的模特,Spotify 上有大量 AI 生成的歌曲,亚马逊上有大量 AI 撰写的作品,YouTube 上有大量 AI 合成的视频。AI 正在污染我们的文化。生态学家 Garrett Hardin 曾指出,污染问题是人类出于自身利益行事而造成的,他称之为“公地悲剧”。我们正经历新的公地悲剧:短期自身经济利益鼓励使用廉价的 AI。内容是为了最大化点击量和浏览量,这反过来又污染文化,削弱对现实的把握。
麦克罗波洛智库 (MacroPolo) 分析了神经网络和深度学习领域流行论文作者的求学经历和工作机构。数据显示,中国和美国是顶级 AI 人才的主要来源地和目标工作地,70% 的顶级 AI 人才在中国或美国的机构中工作,65% 的顶级 AI 人才出自中美两国。美国拥有全球 60% 的顶级AI研究机构,是全球最精英(前 2%)AI 人才的首选就业目的地,57% 的最精英的 AI 人才首选在美国就业。中国仅次于美国,是美国的最大竞争对手,但也只有 12% 的最精英的 AI 人才首选在中国就业,差距非常明显。中国是全球最大的顶级 AI 人才输出国,在中国接受本科教育的顶级(前20%)AI 人才占全球 47%,在美国接受本科教育的只占 18%。
Anthropic 最近发布的 Claude 3 Opus 大模型在 Chatbot Arena 上首次击败了 OpenAI 的 GPT-4。Chatbot Arena 是 AI 研究员用于衡量 AI 语言模型相对能力的众包排行榜。自 GPT-4 于 2023 年 5 月 10 日被纳入 Chatbot Arena 以来,GPT-4 不同版本一直高居榜首,它被拉下榜首具有重要意义。独立 AI 研究员 Simon Willison 称,这是第一次最好的可用 AI 模型来自于 OpenAI 之外的提供商。但 GPT-4 已发布一年多时间,其它 AI 公司花了一年才赶上。
英特尔和微软开始讨论在 PC 本地运行软件巨人的 AI 聊天机器人 Copilot。现阶段 Copilot 依赖于云端处理请求,本地运行不仅能更快响应,而且有助于保护用户隐私。目前配备神经网络处理器(NPU)的 Windows PC 还比较少,现有的 Windows 系统也很少用到 NPU。苹果和 Google 设备配备的 NPU 主要用于处理图像和音频功能,如面部识别和物体识别、OCR、实时转录和翻译等。英特尔表示,未来 AI PC 所配备的 NPU 处理速度需要达到 40 TOPS(万亿次运算)。英特尔 Meteor Lake 笔记本芯片使用的 NPU 速度为 10 TOPS,AMD Ryzen 7040 和 8040 笔电芯片的 NPU 速度分别达到 10 TOPS 和 16 TOPS。高通 Snapdragon X 芯片的 NPU 能达到 45 TOPS,可能是目前唯一满足 AI PC 规格的芯片。
亚马逊向 AI 初创企业 Anthropic 追加了 27.5 亿美元投资,使其总投资达到了 40 亿美元。这笔交易是亚马逊有史以来最大的一笔风险投资。大型科技公司争夺蓬勃发展的 AI 领域主导地位的竞争正愈演愈烈。作为交易的一部分,Anthropic 同意使用亚马逊 AWS 数据中心和亚马逊自己的定制芯片。Anthropic 的投资者还包括了 Google,它此前也承诺使用 Google 的定制芯片。Google 和 AWS 都是 Anthropic 的云计算合作伙伴。Anthropic 由 OpenAI 前员工于 2021 年创办,已成为 OpenAI 在 AI 领域最强大竞争对手之一。Anthropic 的 AI 聊天机器人被称为 Claude,它在本月初宣布了 Claude 3,在基准测试中超过了 OpenAI 的 GPT 4 和 Google 的 Gemini Ultra。
英国国家电网 CEO John Pettigrew 周二表示,AI 的蓬勃发展需要更多算力,未来十年英国数据中心的电力需求将增长六倍。这将加大电网的压力。他表示,AI 个量子计算等基础技术未来的增长将意味着更大规模、能源密集型的计算基础设施。其他国家面临相同的情况。国际能源署预测,未来三年,数据中心、AI 和加密货币的全球电力需求可能会增加一倍以上。