文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 错别字 (1 points, 一般) by 陈少举 在 2024年11月02日23时42分 星期六 评论到 Linus Torvalds 用电动汽车取代了燃油汽车
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年09月25日21时26分 星期三 评论到 美国汽车召回愈五分之一是修复软件
- Guo farm accumulated wealth, the ants lost all the (1 points, 一般) by solidot1727141937 在 2024年09月24日09时39分 星期二 评论到 日本科学家用猫制作 iPS 细胞
- 但是又快又便宜 (1 points, 一般) by Craynic 在 2024年09月09日13时12分 星期一 评论到 澳大利亚政府研究发现 AI 在概述上的表现比人类差
- (1 points, 一般) by gashero 在 2024年09月04日12时41分 星期三 评论到 众多高校撤销外语专业
- 让他们贴支付宝或微信捐款的方式 (1 points, 一般) by solidot1725066425 在 2024年08月31日09时08分 星期六 评论到 KDE 将每年通过桌面通知请求一次捐赠
- 更现代? (1 points, 一般) by Craynic 在 2024年08月28日13时15分 星期三 评论到 微软撤回了弃用控制面板的声明
- 对延迟退休的错误理解 (1 points, 一般) by solidot1723550599 在 2024年08月13日20时09分 星期二 评论到 中国人 50 岁后还能健康工作多少年?
- (1 points, 一般) by solidot1723275683 在 2024年08月10日15时45分 星期六 评论到 甜味剂赤藻糖醇可能增加心血管疾病风险
- 不值得信任google (1 points, 一般) by solidot1722426862 在 2024年07月31日19时56分 星期三 评论到 Chrome 服务故障导致部分用户无法访问保存的密码
YouTube 主播 Yannic Kilcher 使用 4chan 匿名论坛政治不正确讨论版块 /pol/ 三年的内容训练了一个 AI 语言模型。 /pol/ 是 4chan 上最活跃的版块,以其种族主义和其它极右极端主义内容著称。Kilcher 将该 AI 模型用于 10 个机器人程序,然后去 /pol/ 上发帖,24 小时发了 1.5 万个帖子,占了当天该版块所有帖子的十分之一。该语言模型被命名为 GPT-4chan,它在模仿 /pol/ 用户发帖上做到了惟妙惟肖,虽然偶尔会犯错,但该版块的用户花了两天时间才注意到问题,并识别出了其中一个机器人账号。机器人账号导致了用户之间的不信任,即使 Kilcher 关闭机器人程序之后用户彼此之间仍然会指责对方是机器人。
开源 Python 机器学习库 PyTorch 成为 Linux 基金会托管的顶级项目。Linux 基金会的核心使命是协作开发开源软件。PyTorch 项目同时宣布成立基金会,其理事会的核心成员包括 AMD、Amazon Web Services (AWS)、Google Cloud、Meta、Microsoft Azure 和 NVIDIA。PyTorch 最早由 Meta/Facebook 创建,也主要由 Meta AI 开发。自 2017 年以来逾 2400 名开发者在 PyTorch 基础上创建了 54000 个项目,PyTorch 成为了 AI 研究的主要平台之一。
今年早些时候 OpenAI、Google 和 Meta 先后宣布了各自的自然语言图像合成 AI 模型,但曲高和寡,能接触到的人并不多,直到 8 月 22 日 Stability AI 开源了它的 AI 模型 Stable Diffusion,称在质量上能匹敌 OpenAI 的 DALL-E 2。Stable Diffusion 的优势是能运行在单张显卡上,测试显示使用英伟达的 RTX 3060 12GB GPU,能在 10 秒内生成 512×512 图像,如果显卡升级为高端的 3090 Ti,生成每幅图像只需要 4 秒。即使你没有英伟达的显卡,你也可以利用在线 DEMO 排队去生成文本图像。仅仅过去一周, Stable Diffusion 就吸引了数十个项目。在 Reddit 的 Stable Diffusion 非官方论坛上,数以万计的用户在分享用该模型生成的合成图像。AI 合成图像如何影响我们还有待观察。
最近开源的自然语言图像合成模型 Stable Diffusion 引发了社区和用户的浓厚兴趣。Stable Diffusion 的一大优势是能运行在单张显卡上,包括苹果的 M1 Mac GPU,因此普通用户也可以在本地使用,不需要上云端。利用 Stable Diffusion 一位名叫 frigis9 的网友更新了经典 MS-DOS 游戏的图像,将像素图变成细节非常丰富的图像,效果令人称奇。
通用旗下的无人驾驶汽车公司 Cruise 在发生车祸导致一位乘客受伤后召回了无人驾驶出租车。Cruise 前不久获得了完全无人驾驶出租车的商业服务许可,出租车的工作时间限制在晚上十点到凌晨六点之间。事故发生时无人驾驶出租车在十字路口左转然后停了下来,它猜测迎面而来的一辆汽车会转弯,结果是汽车迎面与出租车相撞。Cruise 称这辆汽车在限速 25 英里/时的车道上以大约 40 英里时速行驶,公司发言人拒绝发布车祸视频。该公司表示召回无人驾驶出租车是出于对公众透明的考虑。
AI 创造的艺术打败了人类创造的艺术。在美国科罗拉多州的艺术竞赛中,名叫 Jason Allen 的艺术家递交的作品《Théåtre D'opéra Spatial》赢得了 Digital Arts/Digitally Manipulated Photography 类别的第一名。Allen 使用商业图像合成模型 Midjourney 生成了一系列图像,然后放大打印在画布上递交参与比赛。他的胜利引发了有关艺术的性质和何为艺术家的热烈讨论。有人认为 AI 的出现将会导致所有人类艺术家被机器所取代,其他人认为艺术会适应新的技术并演化发展,比如音乐合成器。
AI 技术发现逾 2 万个未申报游泳池给法国税务部门带来了一笔意外之财。因为建造水池能提高房价,意味着更高的财产税,根据法国法律业主需要申报。平均面积 30 平方米的游泳池每年的税收为 200 欧元。2020 年法国有逾 320 万个私人游泳池,新冠疫情期间愈来愈多的人在家办公,游泳池的安装量也进一步激增。法国税务部门使用的软件由 Google 和咨询公司 Capgemini 开发。除了寻找未申报游泳池,税务部门还计划用它发现未申报的房屋扩建、庭院或凉亭,这些扩建建筑都会提高房产税。
Google 研究院发布了 AI 图像降噪工具 MultiNerf。源代码托管在 GitHub 上,采用 Apache License 2.0 许可证。MultiNerf 的算法运行在原始图像数据上,利用 AI 计算出没有噪声的图像会怎么样。Google 研究人员在今年 5 月发布一则视频(YouTube)演示了其工作原理。
微软的代码建议完成工具 GitHub Copilot 可能是完美的编程考试作弊工具。马萨诸塞大学阿默斯特分校的 CS 教授 Emery Berger 对教师发出警告,认为 Copilot 就像是学生带着乌兹枪去参加刀战,让传统的编程考试变得毫无意义,因为 Copilot 知道所有答案。对使用 Copilot 的学生而言,教师的课程目标就像是敲一下 Tab 键去生成期望输出的代码。Berger 称,Copilot 不同于在编程问答社区 Stack Overflow 搜索答案,你能在网上找到示例代码,教师也能这么做,然后可以用剽窃检测工具对比下代码。Copilot 能生成网上没有的代码。他认为编程教学需要适应这一新情况。
Google 将虚拟聊天机器人的自然语言对话能力与实体机器人结合起来,演示了能在休息室里为其员工拿苏打和薯条的机器人服务员。该机器人尚未做好商用的准备,只能做少数简单的动作,甚至未整合 OK, Google 召唤功能。机器人能解释自然语言命令,权衡可能的行动,计划以较少的步骤实现要求。机器人使用了来自维基百科、社交媒体等来源的文字去训练其语言理解能力。它由子公司 Everyday Robots 设计,目前的功能是给员工拿零食。
过去十年的大部分 AI 系统都是基于监督学习,利用人工标注的数据集进行训练。它们取得了巨大的成功,但也存在明显的缺陷。此类的 AI 对于理解大脑如何工作没什么帮助,因为包括人类在内的动物是不依靠已标注数据集学习的。生物大脑通过探索环境获得对世界的深入理解。科学家们开始探索自我监督学习的机器学习算法,此类神经网络显示出了与大脑如何工作的相似性。当然大脑的工作不只是限于自我监督式学习,它充满了反馈连接,现有的自学式 AI 缺乏此类功能。AI 模型还有很长的路要走。
DeepMind 去年 7 月发布了预测蛋白质结构的 AI 系统 AlphaFold 的源代码,并创建了一个数据库 AlphaFold Protein Structure Database (AlphaFold DB) 。一年之后,AlphaFold 已被逾百万研究人员访问,被用于解决重要的真实世界问题,从塑料污染到抗生素抵抗。DeepMind 现在宣布与 EMBL European Bioinformatics Institute (EMBL-EBI)合作,发布所有已知蛋白质的预测结构,将 AlphaFold DB 规模扩大逾 200 倍——从接近一百万增加到逾两亿——有望提高我们对生物学的理解。所有结构将可通过 Google Cloud Public Datasets 批量下载。
前 Google CEO Eric Schmidt 将 AI 比作核武器,呼吁建立类似相互保证毁灭的威慑制度,防止世界最强大的国家率先发动攻击。Schmidt 称,在不遥远的未来中美可能需要围绕 AI 制定条约,在上个世纪的 50 年代和 60 年代,美国和苏联这两个超级大国最终达成了 《禁止在大气层、外层空间和水下进行核武器试验条约》,这是一个限制核武器试验的国际条约,旨在减缓军备竞赛和减少大气中过量的放射性尘埃。Schmidt 认为中国和美国可能需要在 AI 领域达成类似的条约。
在掌握海量数据,对用户进行几乎完美的跟踪之后,AI 是否就无所不能了?伊利诺伊大学和斯坦福大学的经济学家研究了机器学习在预测消费者选择上的能力,他们的结论是预测消费者选择非常困难,AI 并不特别擅长。他们发现,即时信息如用户评论、推荐和新选择对决策有愈来愈大的影响,这些信息不能事先测量和预期,大数据可用于改善预测,但程度甚微,预测仍然非常不精确。
根据发表在《Nature Machine Intelligence》期刊上的一项研究,德国马普智能系统研究所(MPI-IS)研究人员建造了一个四足机器狗“Morti”,它仅仅用了一小时就学会了走路。Morti 充分利用了复杂的腿部力学,通过贝叶斯优化算法指导学习:其足部传感器信息与机器狗中运行的建模虚拟脊髓的目标数据相匹配。机器狗通过不断比较发送的和预期的传感器信息、运行反射循环以及调整其电机控制模式来学习行走。在人类和动物中,中央模式发生器(CPG)是脊髓中的神经元网络,可在没有大脑输入的情况下产生周期性的肌肉收缩。其有助于生成有节奏的任务,例如步行、眨眼或消化。机器狗在大约一小时内比动物更快地优化其运动模式。
人工智能研究实验室OpenAI 在四月发布了 DALL-E 2,2021 年发布的 DALL-E 的继任者。两个人工智能系统都能根据自然语言文本描述生成令人惊叹的图像;它们能制作看起来像照片、插图、绘画、动画,以及基本上你可以用文字表达出来的任何艺术风格的图像。DALL-E 2 有诸多改善:更好的分辨率、更快的处理速度和一个编辑器功能,编辑器允许用户仅使用文本命令对生成的图像进行修改,例如“用植物替代花瓶”或“让狗的鼻子变大”。用户还可以上传自己的图像,然后告诉人工智能系统如何对其进行调整。世界对 DALL-E 2 的最初反应是惊叹和高兴。可以在几秒钟之内将任何物体和生物组合在一起;可以模仿任何艺术风格;可以描绘任何位置;并且可以描绘出任何照明条件。例如看到一副毕加索风格的鹦鹉翻煎饼图像,谁能不印象深刻呢?可当人们思考哪些行业容易被这种技术颠覆的时候,担忧出现了。
OpenAI 尚未向公众、商业实体甚至整个人工智能社区发布该技术。OpenAI 研究员 Mark Chen 对 IEEE Spectrum 表示:“我们也和人们一样对滥用感到担忧,这是我们非常重视的事情。”该公司邀请了一些人尝试 DALL-E 2,允许他们与全世界分享他们的成果。有限公开测试的政策与 Google 的政策形成鲜明对比,后者刚刚发布了自己的文本到图像生成器 Imagen。在发布该系统时,Google 宣布不会发布代码或公开演示,因为存在滥用和生成有害图像的风险。Google 发布了一些非常令人印象深刻的图片,但没有向世界展示任何它所暗示的、有问题的内容。
OpenAI 尚未向公众、商业实体甚至整个人工智能社区发布该技术。OpenAI 研究员 Mark Chen 对 IEEE Spectrum 表示:“我们也和人们一样对滥用感到担忧,这是我们非常重视的事情。”该公司邀请了一些人尝试 DALL-E 2,允许他们与全世界分享他们的成果。有限公开测试的政策与 Google 的政策形成鲜明对比,后者刚刚发布了自己的文本到图像生成器 Imagen。在发布该系统时,Google 宣布不会发布代码或公开演示,因为存在滥用和生成有害图像的风险。Google 发布了一些非常令人印象深刻的图片,但没有向世界展示任何它所暗示的、有问题的内容。