文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
知名物理学家加来道雄认为 AI 聊天机器人是炒作,即将到来的真正科技革命是量子计算。加来承认 AI 聊天机器人在内容生成上的效率,但强调了它们在区分事实虚构等方面的局限性,认为聊天机器人只是重新排列互联网内容的“美化过的录音机”。他的批评呼应了前 Google AI 专家 Meredith Whittaker 的评论。Whittaker 认为,AI 聊天机器人没有智能,它们所做的和过去二十年互联网上发生的事情类似,某种扭曲的镜子,设计吐出看似合理的东西。加来认为我们应该去关注即将到来的量子计算革命,他认为量子计算将改变历史进程。
美国公司正在竞相高薪招 AI 人才,部分公司将薪酬提高到了 7 位数字。部分公司还表示愿意收购小型 AI 创业公司以获得人才。Match Group 的约会平台 Hinge 正在招聘一位 AI 和机器学习副总裁,基础年薪为 $332,000-$398,000;Upwork 给 AI 和机器学习副总裁制定的年薪为 $260,000- $437,000。亚马逊的应用科学和生成 AI 高级经理职位的薪酬最高 $340,300。Netflix 将 AI 产品经理的年薪提高到最高 $900,000。不是所有 AI 相关职位的薪酬都如此丰厚。提示工程师(prompt engineer)的年薪大约 $130,000,机器学习产品工程师的年薪平均为 $143,589。沃尔玛生成式 AI 团队职位的年薪在 $168,000- $252,000;宝洁的 AI 工程师基本工资 $110,000- $132,000;高盛 AI 工程师基本工资 $150,000 - $250,000。
图书分析网站 Prosecraft 本月早些时候引起了作家们的注意。该网站提供了逾 2.5 万本图书写作和叙事风格的分析,提供了副词计数等语言统计数据,还能提供特定单词的排名。Prosecraft 显然不太可能获得所有分析图书的版权许可,在生成式 AI 版权争议引发广泛关注的背景下,这个与 AI 没有多少关系的图书统计分析网站成为作家们抗议的焦点,不到 24 小时就收到了数百封投诉,创始人 Benji Smith 随后下线了网站。Smith 是在 2017 年上线了 Prosecraft,当时是将其视为副业中副业。它的创意来自于 Smith 在阅读图书时对单词计数的爱好。Prosecraft 使用了算法,但根本称不上生成式 AI。但 Smith 在关闭声明中承认,他从盗版电子书网站抓取了书籍数据库。他没有购买其中任何一本书。作家们表示他们并不反对使用盗版图书库,他们反对的是以此牟利。
生成式 AI 工具的流行加剧了编程问答网站 Stack Overflow 的流量下降趋势。在 Stack Overflow 询问编程问题是有门槛的,而询问 ChatGPT 则能及时获得友好的回答,即使答案有可能是错误的。今天很多人都是询问 ChatGPT 而不是到 Stack Overflow 提问。在此背景下,Stack Overflow 宣布创建了一个专门讨论生成式 AI 提示词的社区 GenAI Stack Exchange,以及它的生成式 AI 工具 OverflowAI,帮助开发者找到编程问题的答案。它的预览版目前开放注册。
普渡大学的研究人员发表了一篇论文预印本,他们用 517 个 Stack Overflow 问题测试了 OpenAI 的聊天机器人 ChatGPT,从正确性、一致性、全面性和简洁等方面对答案进行评估。他们还向 12 位人类参与者询问了 AI 生成的结果。他们的分析显示,ChatGPT 的结果有 52% 错误的,77% 太冗长。而人类只有在错误非常明显的情况下才能识别出来,他们在 39.34% 的情况下偏爱 ChatGPT 的答案,而这些答案中 77% 是错误的。即使答案明显错误,但因为其语言风格更令人感到愉快以及感到具有权威性,人类还是会青睐 AI 生成的答案。
今天的大模型主要用英伟达的 GPU 训练,但让英伟达一家独大对整个生态系统并不是好事。MLC(Machine learning compilation) 项目正致力于在 AMD GPU 上编译和部署大模型,实现与英伟达 GPU 相当的性能。相对于英伟达深耕了近二十年的 CUDA 软件生态系统,AMD GPU 最大问题在于软件支持,它正通过投资 ROCm 缩小与英伟达的差距。MLC 是一项新兴技术,旨在编译和自动优化机器学习工作负载。它不会为每个后端如 ROCm 或 CUDA 构造特定的内核,而是自动为不同后端生成代码。开发者称,MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的八成,而 7900 XTX 的价格只有 RTX 4090 的六成。
FT 援引知情人士的消息报道,百度、字节跳动、腾讯和阿里巴巴今年从英伟达订购了价值 10 亿美元约 10 万张 A800 数据中心 GPU,额外加购的 40 亿美元英伟达 GPU 将在明年交付。A800 是弱化版的 A100 GPU,为了遵守美国去年颁布的出口限制,英伟达专为中国市场开发了降低数据传输率的 A800——A100 的传输率达到 800 GB/s,而 A800 降至了 600 GB/s。因为担心拜登政府颁布新的出口限制,中国互联网巨头疯狂囤积了英伟达的 A800 芯片。一位匿名百度员工说,没有英伟达的芯片,就没办法训练任何大语言模型。在 ChatGPT 大获成功之后,中国的互联网巨头都在开发自己的大模型。字节跳动开发的一个 AI 聊天机器人代号为 Grace,它为此已经囤积了约至少 1 万张英伟达 GPU,加购的约 7 万张 A800 将在明年交付,价值约 7 亿美元。
Google 就澳大利亚政府的 AI 监管框架递交文件表示,版权法应该修改允许生成式 AI 爬取互联网内容,让版权内容以恰当和合理使用的方式在澳大利亚用于训练 AI 模型,不愿意被训练的内容出版商可以选择退出。Google 最近提出了 robots.txt 的一种替代方案,网站可以在其中明确是否允许爬取内容训练 AI。AI 需要海量数据进行训练,而数据集的版权问题正日益引起关注。版权将是生成式 AI 未来面临的一大问题。
AI 创业公司 Stability AI 宣布了它的 AI 编程助手 StableCode。StableCode 使用了三种不同的模型,基础模型首先使用了 BigCode 的 stack-dataset (v1.2)数据集训练,然后用流行编程语言如 Python、Go、Java、 Javascript、C、markdown 和 C++ 进一步训练。训练使用的总数据量达到了5600 亿 token。基础模型确定之后,指令模型用特定用例微调,以帮助解决复杂的编程任务。
阿里巴巴在今年四月宣布了它的大语言模型通义千问(Tongyi Qianwen 或简写 Qwen)。现在它宣布开源有 70 亿参数的 Qwen-7B 系列模型,源代码托管在 GitHub 上,采用被称为 Tongyi Qianwen LICENSE AGREEMENT 的许可证,有限制条件,如果商业使用,月活用户数超过 1 亿,则需要从阿里巴巴获得授权。这一条件与 Meta 对其 LLaMA 2 大模型的限制类似。阿里巴巴称,Qwen-7B是基于 Transformer 的大语言模型, 在 2.2 万亿 token 的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。相比同规模的开源模型,Qwen-7B 在多个评测数据集上具有显著优势,甚至超出 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等。
IBM 和 Hugging Face 宣布开源最大的地理空间 AI 基础模型 watsonx.ai,使用 NASA 的卫星数据构建而成。模型由 IBM 和 NASA 使用 Harmonized Landsat Sentinel-2 项目在一年内对美国大陆的卫星观测数据进行训练,用洪水和火灾后迹地地图的标记数据进行微调。通过进一步的微调,该基础模型可重新部署用于跟踪森林砍伐、预测农作物产量、检测和监测温室气体等各种任务。
无论是OpenAI的ChatGPT,还是Meta的Llama 2,AI正在颠覆整个世界。
在AI这片前景广阔的机遇之海中,席卷而来的是一阵阵变革风暴。
风暴围绕着科学家、创业者、投资者、行业专家,围绕着层出不穷的大模型,围绕着支撑经济发展的千行百业......甚至,AI风暴围绕着每一个普通人。
对于每一个人来说,与其被AI风暴颠覆,不如勇于直面风口。
现在,行行AI携手科技行者,推出斯坦福机器人庞博士“ChatGPT和LLM系列课程”,掌握大模型技能,学习大模型知识,欲购从速。
在AI这片前景广阔的机遇之海中,席卷而来的是一阵阵变革风暴。
风暴围绕着科学家、创业者、投资者、行业专家,围绕着层出不穷的大模型,围绕着支撑经济发展的千行百业......甚至,AI风暴围绕着每一个普通人。
对于每一个人来说,与其被AI风暴颠覆,不如勇于直面风口。
现在,行行AI携手科技行者,推出斯坦福机器人庞博士“ChatGPT和LLM系列课程”,掌握大模型技能,学习大模型知识,欲购从速。
索价 1100 万美元的高价值域名 AI.com 从今年 2 月开始重定向到 OpenAI 的 ChatGPT 网站,看起来是 OpenAI 收购了该域名。但本周它重定向了马斯克(Elon Musk)旗下的 AI 公司 xAI。域名代理商 Saw.com 此前曾宣布它参与了这次交易,但并没有透露买家是谁。AI.com 的 Whois 信息也没有给出任何答案。一种可能的解释是 OpenAI 收购了 AI.com,然后马斯克从 OpenAI 手中收购了 AI.com。Saw.com 和 xAI 目前尚未对此做出澄清。
Meta 发布了一个开源 AI 工具 AudioCraft,允许用户通过文本提示生成音乐和音频。源代码托管在 GitHub 上,采用 MIT 许可证,模型权重采用 CC BY-NC-SA-4.0 授权,意味着商业使用受限。AudioCraft 包含了三个模型:MusicGen、AudioGen 和 EnCodec。其中 MusicGen 使用了 Meta 拥有的获得授权的音乐数据库训练,能从文本提示生成音乐;AudioGen 使用公共的音效库训练。
Google 计划对其智能助手 Assistant 进行大修,以加入类似 ChatGPT 和 Bard 的生成式 AI 技术。Google 称它对 Assistant 移动版本的修改工作已经启动。作为这一计划的一部分,Google 将会开始重组其 Assistant 团队,少许人会被裁掉。Assistant 团队有数千人,裁员只涉及数十个职位。
Meta 准备推出的 AI 聊天机器人将拥有独特人格,包括冲浪者人格和林肯(Abraham Lincoln)人格。Meta 此举旨在提高其平台上的互动性,因为相比毫无感情特色的 AI 机器人回复,具有类似人类特征的讨论会更有趣。Meta 尚未宣布旗下哪些产品会加入 AI 聊天机器人。可能包括 Instagram、Messenger 和 WhatsApp。该功能预计最早会在 9 月推出。聊天机器人能收集大量用户个人信息,而 Meta 的收入大部分来自广告,它等着你与林肯先生分享你的喜好。
香港众多高校拥抱了 OpenAI 的聊天机器人 ChatGPT。香港科技大学率先引入ChatGPT。6 月 1 日它正式为学生与教职人员提供港科大版 ChatGPT,是香港首所为学生与教职工提供 ChatGPT 的大学。香港中文大学、香港理工大学、香港浸会大学等高校也陆续推出使用 AI 工具的指引,共同希望师生批判性探索和谨慎使用 AI,保障学术诚信。除了在高等教育掀起热潮,AI 也将进入香港的初中课堂。香港教育局 6 月 19 日推出初中 AI 课程教材,介绍 ChatGPT 等前沿的生成式 AI,近一半内容重点关注 AI 的伦理与社会影响。该局指出,ChatGPT 可以成为有价值的教育工具,但要留意抄袭的伦理问题,并期望所有公立中学尽快规划,于 2023/24 学年在“资讯和通讯科技课程”中安排 10 至 14 小时的 AI 课程教授。
研究人员运用 AI 去搜索已灭绝的人类近亲尼安德特人和丹尼索瓦人的蛋白质数据,重新发现新的抗生素。抗生素的研发过去几十年相对缓慢,今天的大部分处方抗生素都有逾 30 年历史,随着抗生素耐药细菌的增加,寻找新抗生素迫在眉睫。已灭绝物种的蛋白质有可能成为新抗生素的来源。大部分物种都会产生具有抗菌特性的短蛋白亚单位肽(peptides)。研究人员用人类已知的肽去训练 AI,然后在智人、尼安德特人和丹尼索瓦人的蛋白质序列中寻找新的具有抗菌的肽。研究人员测试了几十种肽,观察是否能在实验室培养皿中杀死细菌。然后筛选出六种有效的肽——其中四种来自智人,一种来自尼安德特人,一种来自丹尼索瓦人。对小鼠的测试显示这些抗菌肽的效果都比较差,需要调整分子创造出更有效的版本。
著名导演詹姆斯卡梅隆(James Cameron)表示,他同意 AI 专家的观点,认为该技术发展对人类构成了严重的风险。卡梅隆接受采访时表示,他在 1984 年就警告了 AI 的危险,但没人听。他执导的《终结者》系列的第一部是在 1984 年上映的,电影背景是天网觉醒试图灭绝人类,天网派了 T-800 终结者返回 1984 年去杀死人类抵抗军首领的母亲。卡梅隆认为,AI 武器化是最大的危险,AI 的核武器竞赛将把所有人都拖进去,因为你不做的话其他国家会去做,然后不断升级。卡梅隆称 AI 短时间内是无法取代作家的,AI 编的故事不太可能会让观众共情。
流媒体巨头 Netflix 被发现以 90 万美元年薪招 AI 产品经理。这位产品经理的工作范围不是推荐算法,而是内容创造。Netflix 在职位说明中称,AI 正在推动所有业务领域的创新,其中包括帮助他们创造更优秀的内容。Netflix 的机器学习平台在历史上被用于开发推荐算法等,但现在它正被用于内容创造。Netflix 称机器学习正被其工作室用于优化原创电影和电视剧的制作。