solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2022年12月20日 16时48分 星期二
来自梦境救援
OpenAI 的新通用聊天机器人原型 ChatGPT 展现出了令人称奇的问题解决能力和问题回答能力(答案未必正确),它能帮助你撰写论文,从而引发对学生利用 ChatGPT 作弊的担忧。学者、高等教育顾问和认知科学家建议大学开发新的评估模式以应对 AI 对学术诚信构成的威胁。本周大约 130 所大学的代表出席了英国慈善组织 JISC 举办的研讨会。防剽窃软件开发商 Turnitin 的高管 Annie Chechitelli 表示正在开发帮助评估作业中是否存在 AI 辅助痕迹的工具,她同时警告与生成式 AI 展开军备竞赛是没有好处的,教师应该鼓励学生发展批判性思维。此外有研究表明过度依赖此类在线工具可能会影响创造力。

人工智能
Wilson(42865)
发表于2022年12月12日 14时28分 星期一
来自会飞的人
根据发表在《科学》期刊上的一项研究,DeepMind 的 AlphaCode 在编程竞赛中达到了人类水平。AlphaCode 首先使用了 GitHub 上的庞大代码库进行训练,熟悉语法和编码规范。然后收集编程竞赛的数千个问题,训练它将问题描述翻译到代码。举个例子,要求编写程序确定长度为 n 的二进制字符串(0 和 1 序列)中没有任何连续 0 的数量。当遇到新问题时,AlphaCode 会用 Python 或 C++ 编写出候选的编程方案,过滤掉不好的。AlphaCode 能生成多达百万个候选编程方案。为了过滤掉如此多的编程方案,它只保留通过测试用例的 1% 程序。为了进一步缩小范围,它会根据程序的输出与虚拟输入的相似性分群,从最大的群开始逐一递交程序,直到找到成功的程序或达到最大递交限额的 10 个程序。这让它能测试广泛的编程策略。经过训练 AlphaCode 解决了 34% 的指定问题。在至少 5000 人参加的在线编程竞赛中,它的表现超过了 45.7% 的程序员。

人工智能
wanwan(42055)
发表于2022年12月08日 18时02分 星期四
来自安德的首秀
上周旧金山市理事会以 8 票对 3 票通过了致命机器人政策,允许警方在避免更多伤亡的情况下使用遥控机器人携带炸弹移动到枪手或自杀式炸弹袭击者面前,瘫痪或杀死嫌疑人。这一政策引发了广泛争议和抗议,本周旧金山市理事会在第二次投票中以 8 票对 3 票明确禁止警方使用遥控机器人发动致命打击。这是一次 180 度的转弯。理事会的第二次投票通常是仪式性质的,不会改变第一次投票结果。制定该政策的委员会可以对条款进行重新修订,或者完全撤回。如果有新版本,理事会预计会在下周再次对此进行投票。

人工智能
Wilson(42865)
发表于2022年12月07日 16时03分 星期三
来自火星合成人
DeepMind 的 AI DeepNash 在西洋陆军棋(Stratego)中达到了专业级人类玩家的水平。Stratego 是一款需在信息缺失情况下进行战略思考的棋盘游戏。它要比此前 AI 掌握的国际象棋、围棋或扑克复杂得多。在游戏中,双方各有 40 枚棋子,且彼此看不到棋子的真实“身份”。双方轮流移动棋子,来消灭对手的棋子,最终夺得对方军旗或消灭所有能动的棋子的一方获胜。因此,玩家需要进行战略部署、收集信息,并与对方博弈。一局 Stratego 游戏中会有 10^535 种可能的布局。相比之下,围棋的布局有 10^360 种可能。此外,在 Stratego 中,AI 需要推理对手超过 10^66 种部署策略,这使德州扑克中初始的 10^6 种可能情况相形见绌。DeepNash 以提出纳什均衡的数学家约翰·纳什的名字命名。DeepNash 将强化学习算法与深度神经网络相结合,以找到纳什均衡。

人工智能
Wilson(42865)
发表于2022年12月06日 13时03分 星期二
来自光明之子
Adobe 的商业图片库将销售 AI 程序如 Dall-E 和 Stable Diffusion 帮助生成的图像。当一部分人将新兴的 AI 创作工具视为工作的威胁或法律雷区或兼而有之,Adobe 则大力拥抱。Adobe 认为生成性 AI 将会在未来的内容创作中扮演重要角色,它不认为 AI 将会替代人类艺术家,而是作为一种补充。它现在允许销售 AI 帮助生成的图像,条件是这些图像必须明确标明。Getty Images 等商业图片库则在早些时候宣布不接受 AI 生成的图像。
人工智能
Wilson(42865)
发表于2022年12月05日 14时37分 星期一
来自约翰的预言
OpenAI 的新通用聊天机器人原型 ChatGPT 过去几天风靡一时,它在解决各种问题上的能力使其可以成为 Google 等搜索引擎和 Stack Overflow 等编程问答社区的部分替代。Stack Overflow 上也涌入了大量用 ChatGPT 生成的问题答案。Stack Overflow 社区现在发表了一则声明,宣布临时封杀 ChatGPT。Stack Overflow 称 ChatGPT 答案的正确率非常低,因此对整个网站以及寻求正确答案的用户来说是有害的。如果用户被发现使用 ChatGPT 回答问题,他们可能会受到禁止继续发帖的惩罚。

人工智能
wanwan(42055)
发表于2022年12月02日 22时38分 星期五
来自西塔甘达
OpenAI 发布了一个通用聊天机器人的原型 ChatGPT,能与用户展开各种主题的对话。ChatGPT 是基于 OpenAI 的 GPT-3.5 模型,能像人类一样流畅对话,展现了聊天机器人过去几年的巨大进步。它也展现了聊天机器人的缺陷,将错误或虚假的信息作为事实呈现。AI 研究人员解释说,聊天机器人仍然是某种“随机鹦鹉”,其知识来自于训练数据中的统计规律,对世界的理解与人类不同。它能帮助用户调试代码,带着某种随意的语气说某个循环条件出错了,或者像黑帮成员那样解释冒泡算法,它还能写情景喜剧的剧本,解释不同科学概念,写学术论文,拥有着广博的知识。但它仍然是典型的聊天机器人,会回避敏感主题的讨论。

人工智能
Wilson(42865)
发表于2022年12月01日 21时13分 星期四
来自安德的首秀
迪斯尼研究人员演示了能改变演员年龄的新神经网络。它能自动化修改演员视觉年龄,比旧方法成本更低时间更短。旧的修改年龄的方法需要视觉特效的工作人员或者使用 3D 扫描和 3D 建模,或者使用类似 Photoshop 的工具对演员脸部的 2D 逐帧修饰,这一过程通常需要耗费数周甚至更长时间。迪士尼的新神经网络被称为 Face Re-aging Network (FRAN),将整个过程自动化。迪士尼的研究人员首先用 StyleGAN2 随机生成数千张 18-85 岁的合成脸部数据进行训练,了解人的脸部如何随年龄变化的一般规律,然后逐帧应用于真实的演员。论文递交到了本月举行的 2022 ACM SIGGRAPH 会议。

人工智能
faif(889)
发表于2022年11月25日 22时20分 星期五
来自记忆残留
Google 一个秘密项目是利用机器学习训练 AI 写代码、修代码和自我更新。该项目是 Google 生成式 AI 计划的一部分,可能会对开发者编写代码产生深远影响。它最初属于 Alphabet 的研发部门 X,代号 Pitchfork,今年夏天转入 Google 的 Labs 群组,这意味着其重要性在提高。Pitchfork 现在属于 Google Labs 的 AI Developer Assistance 小组,由 Olivia Hatalsky 负责, 她曾参与 Google Glass 等项目,是 X 的资深员工,随 Pitchfork 一起迁到 Google Labs。Pitchfork 设计通过学习编程风格写出新的代码。

人工智能
faif(889)
发表于2022年11月24日 16时00分 星期四
来自地球的呼唤
Meta 透露了在策略游戏《外交(Diplomacy)》中达到人类水平的 AI Cicero。这款游戏涉及社交技能,玩家在游戏中扮演不同国家进行合作对抗。这是一个涉及合作和竞争的战略游戏,强调七个玩家之间的自然语言谈判和战术协调。AI 必须表现出同理心,使用人类的语言交流,建立人际关系才能获胜,这对 AI 玩家来说是一项艰巨的任务。Cicero 通过《外交》学习了自己的技能,随着时间的推移成为游戏高手。Cicero 将语言模型的规划和强化学习算法相结合,可以通过对话推断玩家的信念和意图,并根据其计划生成对话。在《外交》游戏的 40 场匿名在线比赛中,Cicero 的平均得分是人类选手的两倍多,在 72 小时的比赛中,它发送了 527 7条信息,在不止一场比赛中排名前 10%。Cicero 目前仍只能协调玩家在当前回合的行动。它没有能力模拟对话在游戏的长期过程中如何影响与其他玩家的关系。AI 可以通过预测整局比赛走势制定发言计划,但却很难预测发言后对游戏内人际关系的长期影响。

人工智能
faif(889)
发表于2022年11月24日 15时27分 星期四
来自奥泊城的珍宝
创业公司 Stability AI 宣布释出开源文本图像模型 Stable Diffusion 的 v2.0 版本。新特性包括:用全新文本编码器 OpenCLI 训练的文本图像模型,比 1.0 版本显著改进了生成图像的质量,模型现在能以默认分辨率 512x512 和 768x768 生成图像;Upscaler Diffusion 模型增强了图像分辨率,系统现在能生成 2048x2048 或更高分辨率的图像;新模型 depth2img 能推断输入图像的深度,能利用深度信息生成新图像;等等。

人工智能
WinterIsComing(31822)
发表于2022年11月24日 14时48分 星期四
来自奥泊城的珍宝
创业公司 Stability AI 宣布释出开源文本图像模型 Stable Diffusion 的 v2.0 版本。新特性包括:用全新文本编码器 OpenCLI 训练的文本图像模型,比 1.0 版本显著改进了生成图像的质量,模型现在能以默认分辨率 512x512 和 768x768 生成图像;Upscaler Diffusion 模型增强了图像分辨率,系统现在能生成 2048x2048 或更高分辨率的图像;新模型 depth2img 能推断输入图像的深度,能利用深度信息生成新图像;等等。

人工智能
WinterIsComing(31822)
发表于2022年11月22日 17时28分 星期二
来自虚拟现实
英伟达的研究人员演示了文本 3D 模型生成系统 Magic3D,它能让任何人无需任何训练就能创造 3D 模型。类似 DALL-E 和 Stable Diffusion 等文本图像生成模型,Magic3D 在输入一段文字系统就能产生相应的 3D 模型,举例来说,输入“一只蓝毒箭蛙坐在水莲上”,系统就会生成相应的 3D 模型,改变其中的描述也会改变模型中的对象。Google 研究人员在今年 9 月宣布了它的文本 3D 模型 DreamFusion,英伟达的 Magic3D 生成 3D 模型的速度比 DreamFusion 快两倍。研究人员在预印本平台 arxiv 上发表了论文,但并没有公布相应的代码。

iPhone
WinterIsComing(31822)
发表于2022年11月11日 14时49分 星期五
来自黑暗平原
名叫 Liu Liu 的美国旧金山开发者在 App Store 上发布了一个免费应用 Draw Things: AI Generation,将开源文本图像生成模型 Stable Diffusion 带到 iPhone 平台。Stable Diffusion 的一大优势是能运行在单张英伟达的中高端显卡上,有开发者对其进行优化之后能运行在普通显卡上。Liu Liu 对其进一步优化使其能运行在 iPhone 上。Liu Liu 称主要挑战在于内存占用,如果 iPhone 的内存有 6GB,当一个应用占用超过 2.8 GB 之后 iOS 会开始将其杀死;如果内存只有 4GB,那么超过 2GB 之后就会被干掉。测试显示,在 Phone 11 Pro 上生成一幅 384×384 图像耗时逾两分钟,如果是 iPhone 14 Pro 则所需时间会更少。

人工智能
WinterIsComing(31822)
发表于2022年11月08日 23时41分 星期二
来自失忆者
2016 年前顶尖的人类围棋棋手仍然能打败顶尖的围棋 AI。但在使用神经网络通过自我对弈精通围棋的 DeepMind AlphaGo 之后,人类就一败涂地了。最近 KataGo 作为一种开源围棋 AI 而风行一时。上周一组研究人员发表论文,描述了利用 KataGo 盲点的对抗性技术去挫败 KataGo 的方法。通过 KataGo 训练集之外出乎意料的落子,一个会输给业余棋手的对抗性围棋程序能击败 KataGo。KataGo 使用数百万次自我对弈学习围棋,但这仍然不足以覆盖所有可能的情况,留下了可利用的漏洞。研究人员的对抗性围棋程序发现 KataGo 容易受 off-distribution 等策略的影响。研究显示,达到人类水平的 AI 往往会犯一些非常奇怪的错误,以让人类感到惊讶的方式失败。如果 AI 在安全关键系统中犯下类似的错误,可能会导致严重后果。

Facebook
WinterIsComing(31822)
发表于2022年11月02日 23时57分 星期三
来自尘埃记
Google 旗下的 AI 子公司 DeepMind 今年早些时候宣布了预测蛋白质结构的 AI 系统 AlphaFold。现在社交网络巨头 Meta/Facebook 的研究人员完成了类似的工作,他们利用了一种语言模型,用已知的蛋白质结构序列进行训练,然后再用它去预测其它蛋白质的结构。研究人员将他们的 AI 模型称为 ESMFold,它没有 AlphaFold 精确,但预测蛋白质结构的速度是 AlphaFold 的 60 倍。研究人员用了两周时间预测了逾 6.17 亿蛋白质的结构,相比之下 AlphaFold 需要用数分钟才能完成一个蛋白质结构的预测。在 6.17 亿结构中,逾三分之一被认为是高质量的,被认为是正确的。其中有数百万是全新的,与已知蛋白质结构数据库都不同。

Facebook
WinterIsComing(31822)
发表于2022年11月02日 23时25分 星期三
来自造星主
Meta/Facebook 宣布了 AI 驱动的新音频编解码器 EnCodec,压缩后的大小仅为 MP3 文件格式的十分之一。Meta 表示这项技术能显著改善低带宽下的语音声音质量。Meta 同时在预印本平台 arxiv 上发表了论文《High Fidelity Neural Audio Compression》。新的方法由三部分组成,首先编码器将未压缩数据转换成低帧率的潜在空间(latent space)表示;量化器 quantizer 随后压缩表示到目标大小,同时跟踪最重要信息以用于未来重建原始信号;解码器最后用单 CPU 上的神经网络将压缩后的数据实时转变成音频。研究人员表示他们是第一个实现将神经网络技术应用于压缩 48 kHz 立体声。

人工智能
WinterIsComing(31822)
发表于2022年10月21日 23时18分 星期五
来自猛兽的财富
美国唱片业协会(RIAA)向美国贸易代表办公室递交了最新的恶名市场名单(PDF),其中包括了 BT 网站、网盘以及盗版串流服务。此外,RIAA 还将 AI 视为新兴的版权威胁。RIAA 称有在线服务利用 AI 创作出与参考的艺术家乐曲相似或几乎一样的新乐曲。RIAA 提到的一个服务是 Songmastr,其底层技术是开源的 Matchering 2.0,代码发布在 GitHub 上。该网站许诺可根据知名乐人如碧昂丝、泰勒斯威夫特、鲍勃迪伦的乐曲创作(或称为 master)相似风格的乐曲。
Facebook
WinterIsComing(31822)
发表于2022年10月21日 19时35分 星期五
来自3001太空漫游
Facebook/Meta 开发出闽南语 AI 翻译系统演示了一段闽南语和英语之间的实时翻译。“我们利用普通话作为中间语言来建立伪标签,我们首先将英语(或闽南语)语音翻译成普通话文本,然后我们再翻译成闽南语(或英语),并将其加入训练数据。”Meta的研究团队称。目前,该系统允许讲闽南语的人与讲英语的人交谈,尽管很生硬。该模型一次只能翻译一个完整的句子。Meta 宣布,除了从这个项目中获得开源的模型和训练数据外,该公司正在发布首个基于闽南语语料库的语音翻译基准系统,以及语音矩阵(SpeechMatrix),“一个使用Meta的LASER数据挖掘技术的大型语音到语音翻译语料库”,这个系统将使研究人员能够创建他们自己的语音到语音翻译(S2ST)系统。
人工智能
WinterIsComing(31822)
发表于2022年10月21日 19时29分 星期五
来自哈特拉斯船长历险记
在 Adobe 的 MAX Sneaks 活动上,它演示了一系列 AI 图像合成工具:Project Clever Composites 使用 AI 和自动化快速合并图像,比如你想把旅游照片中的人像裁剪下来无缝的合并到其它背景中,Clever Composites 可以将整个过程简化成几次点击;另一个实验性功能是 Project Blink,让用户在编辑视频时对视频内容根据特定的文字或对象、声音或运动类型进行搜索;Project All Of Me 利用 AI 生成照片中不存在的部分,如从小图生成大图,从另一个角度生成照片,等等。