奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: Herculaneum 纸草卷轴首个文字在 AI 帮助下成功识别

Wilson(42865)

发表于2023年10月14日 23时48分星期六
来自其主之声

Herculaneum 纸草卷轴是庞贝附近一座私人别墅图书馆的藏品，因公元 79 年维苏威火山喷发而被掩埋，在高温下碳化。1752 年它们被挖掘出来。它们非常脆弱，处理不当就会变成灰烬。如何阅读无法打开的卷轴？这个问题持续了数百年。2019 年肯塔基大学 EduceLab 的 Brent Seales 教授使用粒子加速器对 Herculaneum 卷轴进行了成像，生成了分辨率达 4 µm 的 3D CT 扫描。他的团队还扫描拍摄了有可见墨水的卷轴碎片。企业家 Nat Friedman 和 Daniel Gross 对该项目产生了兴趣，他们在 2023 年 3 月发起挑战赛 Vesuvius Challenge，奖励能识别卷轴文字的人。8 月参赛者 Casey Handmer 报告在 CT 扫描中发现了看起来像是墨水的“裂纹图案”。SpaceX 暑期实习生 Luke Farritor 开始对裂纹图案训练一个机器学习模型，每一个新裂纹的发现都帮助改进了模型。模型很快揭露了人眼看不见的裂纹痕迹，他发现了卷轴的第一个文字——ΠΟΡΦΥΡΑϹ ——意思是紫色的。他赢得了 4 万美元的 First Letters Prize 奖。另一名参赛者 Youssef Nader 也在同一区域发现了相同文字，她作为第二名赢得了 1 万美元。Casey Handmer 作为墨水痕迹的首位发现者获得了 1 万美元的 First Ink Prize。

科技: 微软为绘图应用加入基于 DALL-E 的文本图像生成功能

Wilson(42865)

发表于2023年10月13日 16时19分星期五
来自凡尔纳地球三部曲

微软本周向 Windows Insiders 测试者推送了新版的绘图应用（Paint app），其中包括了 Paint Cocreator，基于 DALL-E 的 AI 文本图像生成功能，用户可通过简短文字去描述想要生成的内容，选择不同的艺术风格，然后点击 Create。Paint Cocreator 将生成一组图像供用户选择。微软称 AI 图像生成功能内置有内容过滤器，防止生成有害的、冒犯性的或不合适的图像。

科技: Google 内部质疑大语言模型的可用性

Wilson(42865)

发表于2023年10月12日 20时11分星期四
来自泰山和蚁人

Google 通过 Discord 邀请了部分 AI 聊天机器人 Bard 的重度使用用户，一起聊天讨论了 AI 工具的有效性和实用性，Google 的产品经理在讨论期间质疑了大模型的可用性。Bard 高级产品经理 Dominik Rabiej 在 7 月的 Discord 聊天中表示，他的经验法则是，除非能独立验证不要相信大模型的输出结果。负责 Bard 用户体验的 Cathy Pearl 说，他认为最大的挑战是，就有用性而言，大模型最擅长什么。Rabiej 则建议将 Bard 作为“创意/头脑风暴应用”使用，也可以将 Bard 用于辅助编程，因为编程的话用户肯定需要检查代码是否有效。

科技: Adobe 演示 AI 上采样技术，将低分辨率动图和视频放大到高分辨率

Wilson(42865)

发表于2023年10月12日 17时36分星期四
来自繁星若尘

Adobe 演示了其开发的实验性 AI 上采样技术，能将低分辨率 GIF 动图和视频片段放大到高分辨率。该项目被称为 Project Res-Up，Adobe 尚未提供开放测试，它使用了基于 diffusion 的上采样技术提升视频分辨率，同时改进清晰度和细节。在演示中，Adobe 从《The Red House(1947)》提取了一段 480 x 360 分辨率的片段，使用上采样放大到 1280 x 960，总像素增加 675%。生成的视频更清晰，AI 移除了绝大部分的模糊，甚至添加了发丝和高亮等新细节。

科技: ChatGPT 等 AI 工具如何改变科学出版

Wilson(42865)

发表于2023年10月11日 21时29分星期三
来自图书馆员与黄金锅

当西雅图华盛顿大学医学院的 Domenico Mastrodicasa 医生在写论文遇到困难时他会求助于 ChatGPT，聊天机器人会在几秒钟内响应查询。他是众多使用生成式 AI 帮助撰写论文的研究人员之一。他购买了付费版本 ChatGPT Plus，每周使用数次，认为它对帮助他理清思路非常有用。很多人预测生成式 AI 将成为撰写论文手稿、同行审议报告和拨款申请的常规助手，认为非母语为英语的研究人员将会受益最多。部分研究人员认为这意味着他们可以将时间更多的投入在研究而不是论文撰写上。加州伯克利的 Michael Eisen 说，写论文从来不是真正的目的，搞科学才是。但生成式 AI 难以避免的不精确性和捏造的内容将是科学出版面临的一大难题。出版商担心这可能会意味着出现更多错误百出的手稿。

科技: 微软据报 GitHub Copilot 业务亏损

Wilson(42865)

发表于2023年10月10日 15时29分星期二
来自苹果树下的宇宙飞船

生成式 AI 热潮给很多公司带来了巨额利润，其中受益最大的可能是 GPU 芯片供不应求的英伟达了。而微软据报道难以受益于其 AI 业务。它为程序员提供的 AI 编程助手 GitHub Copilot 就一直亏损。GitHub Copilot 于 2022 年 6 月推出，月费 10 美元或年费 100 美元。身份验证过的学生和知名开源项目开发者可免费使用。据知情人士透露，微软今年初每月每位用户平均损失逾 20 美元，部分用户损失最高逾 80 美元。微软一直尝试降低 AI 服务费用，其中之一是自研而不是依赖英伟达供应 AI 芯片。软件巨人最早可能会在下个月的 Ignite 大会上宣布其 AI 芯片。

科技: 微型语言模型的时代来临

Wilson(42865)

发表于2023年10月08日 23时16分星期日
来自金刚

学习英语对人类而言并非易事，但计算机学习英语的方法十分简单：将互联网上收集的海量文本输入到名叫神经网络的数学模型中。这是 OpenAI ChatGPT 等生成式 AI 模型背后的工作原理。但这种方法的缺点也十分明显：训练成本昂贵且耗费大量时间。大语言模型的黑箱也让人难以理解其内部工作以及为什么会失败。面对困难，部分研究人员选择了在小型数据集上训练小型模型，然后研究其行为。微软研究人员最近在预印本平台 arxiv.org 上发表论文，介绍了一种训练微型语言模型的新方法：用儿童故事培养它们。 ChatGPT 使用的 GPT-3.5 模型有近 2000 亿个参数，需要至少 1000 个 GPU 训练数周时间。只有少数公司能获得必要的资源。但微软研究人员的研究表明，规模仅为最先进大语言模型数千分之一的微型语言模型在这种方法训练下能很快学会讲述一致且语法正确的故事。这项研究结果或能为新研究指明方向。

科技: 佛罗里达男子持武器击落警方无人机面临 10 年徒刑

Wilson(42865)

发表于2023年10月08日 20时18分星期日
来自红脖

52 岁的佛罗里达男子 Wendell Doyle Goney 本周认罪，他作为一名已定罪重罪犯而持有武器，并使用武器击落了警方无人机，他面临 10 年徒刑，其判决将在明年 1 月 18 日宣布。警方是在 2021 年 7 月出警回应一起入室盗窃案，当使用价值 2.9 万美元的无人机进行户外搜索时，无人机被 Goney 从附近住宅区使用步枪开枪击落。Goney 声称无人机令其不甚烦恼。记录显示，Goney 犯有 29 项重罪，包括恶意伤害警官、暴力拒捕、非法持有毒品、入室盗窃，以及已定罪重罪犯而持有武器。美国联邦法律禁止大多数已定罪重罪犯持有武器。

科技: 日本 AI 草案提出使用方需承担部分责任

Wilson(42865)

发表于2023年10月08日 14时52分星期日
来自勇者物语

为了妥善利用生成文本和图像的生成式 AI，日本政府正推进制定面向企业等的指导方针。草案显示不仅是 AI开发商和服务提供商，使用 AI 开展业务的企业和团体也将承担一定的责任。指导方针明确了创造 AI 基础性技术的“算法开发者”、提供基于 AI 的服务和软件的“服务实施者”以及运用 AI 开展业务的企业等五大业务主体须共同担负责任和义务。草案指出，社会所追求的方向是“开发和使用 AI 是为了拓展人们的能力，使追求幸福成为可能”，“不得以企图侵犯人权、实施恐怖主义及犯罪为目的、或助长上述行为的不当输入输出方式提供或使用 AI”。

科技: AMD 如何跨过英伟达的 CUDA 护城河

Wilson(42865)

发表于2023年10月08日 11时31分星期日
来自歌剧院魅影

生成式 AI 使用的 GPU 基本上指的都是英伟达的产品。英伟达被广泛视为是一家硬件公司，但它的软件工程师数量多于硬件工程师。它对使用其软件工具（CUDA）设定了非常低的门槛，围绕其硬件构建了强大的软件护城河。完全依赖于英伟达的产品对生成式 AI 领域的众多科技公司而言并非好事，其中一大问题是英伟达的产品供不应求。部分大公司拥抱了自研 AI 芯片，而 AMD 和英特尔等也都努力进入这一市场。因为 CUDA 工具的广泛使用，即使不使用英伟达的硬件，其它公司的 GPU 和加速器仍然需要设法支持 CUDA。PyTorch 已经将用户与底层 GPU 架构分离开来，而 AMD ROCm 提供了 CUDA 的开源替代，今天跨越 CUDA 护城河可能就像使用 PyTorch 一样简单。

科技: OpenAI 探索制造自己的 AI 芯片

Wilson(42865)

发表于2023年10月07日 18时38分星期六
来自侦图机

路透援引知情人士的消息报道，OpenAI 正探索自己制造 AI 芯片，评估潜在收购目标。该公司尚未决定是否推进该计划。目前 AI 芯片主要依赖于英伟达的芯片，该公司控制着逾八成的市场份额。OpenAI 想要 AI 芯片供应的多元化。OpenAI 的聊天机器人 ChatGPT 运行成本昂贵，分析师估计每次查询的成本为 4 美分。如果 ChatGPT 的查询份额达到 Google 的十分之一，那么 OpenAI 早期阶段需要价值 481 亿美元的 GPU，后续运行每年还需要 160 亿美元的芯片。

科技: 研究显示大模型在无损压缩上能超过 PNG 和 FLAC

Wilson(42865)

发表于2023年10月01日 21时58分星期日
来自来自12个星球的敌人

Google DeepMind 和 Meta 的研究人员在预印本平台 arXiv 上发表论文《Language Modeling Is Compression》，他们发现 DeepMind 的大语言模型 Chinchilla 70B 在图像和音频的无损压缩上超过了 PNG 和 FLAC。Chinchilla 70B 能将 ImageNet 图像数据库无损压缩到原始大小 43.4%，超过了 PNG 算法的 58.5%。Chinchilla 能将 LibriSpeech 音频数据集中的样本无损压缩到原始大小 16.4%，超过 FLAC 算法的 30.3%。Chinchilla 70B 主要是训练去处理文本，但它在压缩其它类型的数据集上的效果也表现优异，甚至优于专门的算法。

科技: Signal 总裁认为 AI 本质上是一种监控技术

Wilson(42865)

发表于2023年09月27日 17时54分星期三
来自消失吧！书本

AI 模型需要大数据集训练，那数据集来自何处呢？网民。AI 要快速变现，最方便的途径是什么呢？显然是监控。Signal 总裁 Meredith Whittaker 对此评论道，AI 本质上是一种监控技术。这是依赖于货币化用户数据的企业对 AI 十分热衷的一个原因。AI 有助于巩固和扩展监控商业模式。她说，当你走过一个面部识别摄像头，它配备了伪科学的情绪识别功能，它会生成你的数据，不管对错，会说你“快乐、悲伤、脾气不好或骗子”诸如此类。这些终极监控系统正在推销给有权力监控的人，如雇主和政府，其决策和预测将影响我们对资源和机会的获取。

科技: ChatGPT 支持图像和语音命令

Wilson(42865)

发表于2023年09月26日 21时25分星期二
来自空气的颜色

OpenAI 宣布 ChatGPT 的新版本能通过图像和语音与用户交流。举例来说，上传冰箱内部的照片，ChatGPT 能列出根据现有食材可制作的菜肴清单。对于语音交流，用户可选择五种不同的 ChatGPT 的合成声音，其中包括男性和女性声音。新版本将通过 ChatGPT Plus 付费服务提供给客户，该服务月费为 20 美元。语音交流则需要使用 iPhone、iPad 和 Android 设备。ChatGPT 自去年 11 月推出后吸引了数亿用户，新功能将使得 ChatGPT 能挑战 Alexa 和 Siri 等传统语音助手。

科技: 盖蒂与英伟达发布用授权图像训练的生成式 AI

Wilson(42865)

发表于2023年09月25日 23时24分星期一
来自白鸟异传

盖蒂与英伟达合作发布了 Generative AI by Getty Images，完全使用盖蒂图库的授权图像训练的生成式 AI，将该工具生产的图像商业化会受到法律保护。该工具使用了英伟达的 Edify 模型。测试显示，盖蒂 AI 工具的图像质量与 OpenAI 的 DALL-E 3 相近，优于开源图像模型 Stable Diffusion。Getty 工具对用户生成图片的类型有限制，不允许生成任何真实人名的图像。盖蒂对此表示，它无意操纵或再现现实生活的事件。

Meta 准备推出具有个性的 AI 聊天机器人

Wilson(42865)

发表于2023年09月25日 18时38分星期一
来自力量

Meta 最快将于本周在其各社交媒体应用中发布具有鲜明个性的 AI 聊天机器人，以此吸引年轻用户。AI 机器人正在内部测试，Meta 预计会在周三开始的 Meta Connect 会议上宣布首批 AI 智能体(AI agent)。这些机器人将用来推动用户的参与，不过其中一些机器人也可能拥有与生产力相关的技能，比如帮助完成编码或其他任务的能力。Meta 正计划开发几十个 AI 个性聊天机器人。该公司还在开发一款产品，让名人和创作者可以使用自己的 AI 聊天机器人与粉丝和追随者互动。

科技: 亚马逊向 Anthropic 投资最多 40 亿美元

Wilson(42865)

发表于2023年09月25日 17时46分星期一
来自原罪之战：天赐之力

亚马逊宣布向 AI 创业公司 Anthropic 投资至多 40 亿美元，推动 AI 军备竞赛升级。此前微软向 OpenAI 投资数十亿美元。作为交易的一部分，Anthropic 将用亚马逊的定制芯片构建 AI 软件，并使用亚马逊的 AWS 云计算服务。亚马逊则将整合 Anthropic 的 AI 技术。Anthropic 开发了 ChatGPT 之外另一个备受瞩目的 AI 聊天机器人 Claude 2，支持最高 100k 上下文。

科技: 芬兰囚犯帮助训练大模型

Edwards(42866)

发表于2023年09月25日 11时43分星期一
来自科玛

AI 模型需要大量“点击工人”对数据进行训练，比如教 AI 区分行人和棕榈树，或者组合描述暴力或性虐待的词语。“点击工人”通常来自低工资的南半球国家。比如 OpenAI 雇佣的一家外包公司在肯尼亚、乌干达和印度招募“点击工人”。但南半球国家懂芬兰语的很少。因此芬兰 AI 创业公司 Metroc 找到了监狱劳工帮助它训练大模型。40 多岁的女囚 Marmalade 就成为了一名“点击工人”，她的时薪为 1.54 欧元，轮班时间为 3 小时。芬兰以其开放式监狱闻名——囚犯可以在附近城镇工作或学习。但还有部分监狱是封闭式的，关押重刑犯。Marmalade 被判了 6 年，在一个终身监禁囚犯关押 12 年后可申请释放的国家，6 年是一个重刑。

科技: DeepMind 的蛋白质结构预测模型获拉斯克奖

Wilson(42865)

发表于2023年09月22日 18时18分星期五
来自风神秘抄

Google 旗下的 AI 子公司 DeepMind 研发的蛋白质结构预测模型 AlphaFold 获得了拉斯克奖的基础医学研究奖，拉斯克奖颁发三个奖项，另外两个是临床医学研究奖和医学科学特殊成就奖。Demis Hassabis 博士和 John Jumper 博士领导 AlphaFold 团队借助 AI 系统成功解决了蛋白质结构预测难题，实现了准确性和速度的巨大突破。James Fujimoto、David Huang和Eric Swanson 发明的光学相干断层扫描（OCT）技术赢得了临床医学研究奖，OCT 使医生能够迅速检测并治疗影响视力的视网膜疾病，从而拯救了数百万人的视力。医学科学特殊成就奖授予了 Piet Borst。

科技: OpenAI 宣布 DALL-E 3

Wilson(42865)

发表于2023年09月21日 16时07分星期四
来自墨水心

OpenAI 宣布了它的下一代文本图像生成模式 DALL-E 3。该公司计划 10 月份向 ChatGPT+ 和企业客户提供 DALL-E 3，提供给 API 客户的时间未定，只是表示在秋季的某个时候。OpenAI 称，DALL-E 3 改进了细节处理，此前的模型在手指的生成上会出现问题。新版本也改进了图像内文本的处理。DALL-E 3 还与 ChatGPT 紧密集成，允许 ChatGPT 根据当前对话的上下文生成图像。