奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: Google 打败 OpenAI 的计划

Wilson(42865)

发表于2023年08月16日 17时47分星期三
来自风暴之歌

今年四月，Alphabet CEO 皮查伊（Sundar Pichai）做出了一项不同寻常的举动，合并了两个不同文化和风格的大型 AI 团队，此举旨在赶超 OpenAI 等竞争对手。现在考验即将到来，Google 准备在秋季发布该公司成立至今最具有风险性的产品之一：一组大机器学习模型。这些模型统称为 Gemini，能帮助 Google 构建出竞争对手做不到的产品。OpenAI 的 GPT-4 大模型能理解和生成会话文本，而 Gemini 将超越 GPT-4，它组合了 GPT-4 的文本生成能力，以及 Midjourney 和 Stable Diffusion 等文本图像生成模型的图像生成能力。Gemini 还能分析图表，创建带有文本描述的图形，或使用文本或语音命令控制软件。Google 准备将 Gemini 支持其各项服务，从 AI 聊天机器人 Bard 到 Google Docs 和 Slides 等企业应用。Google 还计划通过其云端服务向应用开发者提供 Gemini 的付费访问。

科技: 沙特和阿联酋竞相采购英伟达的 AI 芯片

Wilson(42865)

发表于2023年08月16日 16时24分星期三
来自人猿泰山之米甸探险

沙特和阿联酋加入了全球 AI 军备竞赛，竞相采购英伟达的 AI 芯片。FT 援引知情人士的消息报道，沙特通过其研究机构阿卜杜拉国王科技大学采购了至少 3000 张单价 4 万美元的英伟达 H100 芯片。黄仁勋曾将 H100 形容为第一款专为生成式 AI 设计的芯片。阿联酋也采购了数千张英伟达芯片，正在开发自己的开源大模型 Falcon。美国公司如微软支持 OpenAI 以及 Google 拥有最先进的 AI 模型，它们也是英伟达 H100 和 A100 芯片的主要买家。阿卜杜拉国王科技大学预计会在年底收到这批价值 1.2 亿美元的芯片。

书籍: 美国爱荷华州学区利用 AI 确定禁书名单

Wilson(42865)

发表于2023年08月15日 17时34分星期二
来自人猿泰山之结缘蚁人

美国爱荷华州 Mason 市的学区董事会开始利用 AI 技术识别需要从学区图书馆内清理出的禁书名单。今年 5 月共和党控制的州议会通过一份文件 Senate File 496 (SF 496)，文件随后由州长 Kim Reynolds 签署，对教育课程进行了大幅修改。其中包括限制图书馆和课堂可提供的图书，要求书名满足年龄要求，以及没有“性相关描述”。学区表示他们的图书馆和教室内有大量藏书，有购买的也有捐赠的，逐一检查不可行。他们因此开始使用 AI 去识别可疑图书。目前 AI 标记了 19 本禁书：《Killing Mr. Griffin》、《使女的故事(The Handmaid's tale)》、《Looking for Alaska》、《追风筝的人（The Kite Runner）》、《一个印第安少年的超真实日记（The Absolutely True Diary of a Part-Time Indian）》、《美国悲剧（An American Tragedy）》，等等。

科技: 加来道雄认为 AI 聊天机器人是炒作

Wilson(42865)

发表于2023年08月15日 16时03分星期二
来自科玛

知名物理学家加来道雄认为 AI 聊天机器人是炒作，即将到来的真正科技革命是量子计算。加来承认 AI 聊天机器人在内容生成上的效率，但强调了它们在区分事实虚构等方面的局限性，认为聊天机器人只是重新排列互联网内容的“美化过的录音机”。他的批评呼应了前 Google AI 专家 Meredith Whittaker 的评论。Whittaker 认为，AI 聊天机器人没有智能，它们所做的和过去二十年互联网上发生的事情类似，某种扭曲的镜子，设计吐出看似合理的东西。加来认为我们应该去关注即将到来的量子计算革命，他认为量子计算将改变历史进程。

科技: 美国公司竞相高薪招 AI 人才

Wilson(42865)

发表于2023年08月15日 00时06分星期二
来自守夜者

美国公司正在竞相高薪招 AI 人才，部分公司将薪酬提高到了 7 位数字。部分公司还表示愿意收购小型 AI 创业公司以获得人才。Match Group 的约会平台 Hinge 正在招聘一位 AI 和机器学习副总裁，基础年薪为 $332,000-$398,000；Upwork 给 AI 和机器学习副总裁制定的年薪为 $260,000- $437,000。亚马逊的应用科学和生成 AI 高级经理职位的薪酬最高 $340,300。Netflix 将 AI 产品经理的年薪提高到最高 $900,000。不是所有 AI 相关职位的薪酬都如此丰厚。提示工程师（prompt engineer）的年薪大约 $130,000，机器学习产品工程师的年薪平均为 $143,589。沃尔玛生成式 AI 团队职位的年薪在 $168,000- $252,000；宝洁的 AI 工程师基本工资 $110,000- $132,000；高盛 AI 工程师基本工资 $150,000 - $250,000。

科技: 图书分析项目 Prosecraft 成为 AI 侵权争议的最新受害者

Wilson(42865)

发表于2023年08月14日 19时08分星期一
来自继位之争

图书分析网站 Prosecraft 本月早些时候引起了作家们的注意。该网站提供了逾 2.5 万本图书写作和叙事风格的分析，提供了副词计数等语言统计数据，还能提供特定单词的排名。Prosecraft 显然不太可能获得所有分析图书的版权许可，在生成式 AI 版权争议引发广泛关注的背景下，这个与 AI 没有多少关系的图书统计分析网站成为作家们抗议的焦点，不到 24 小时就收到了数百封投诉，创始人 Benji Smith 随后下线了网站。Smith 是在 2017 年上线了 Prosecraft，当时是将其视为副业中副业。它的创意来自于 Smith 在阅读图书时对单词计数的爱好。Prosecraft 使用了算法，但根本称不上生成式 AI。但 Smith 在关闭声明中承认，他从盗版电子书网站抓取了书籍数据库。他没有购买其中任何一本书。作家们表示他们并不反对使用盗版图书库，他们反对的是以此牟利。

科技: Stack Overflow 开始提供 AI 工具

Wilson(42865)

发表于2023年08月14日 18时13分星期一
来自丽赛的故事

生成式 AI 工具的流行加剧了编程问答网站 Stack Overflow 的流量下降趋势。在 Stack Overflow 询问编程问题是有门槛的，而询问 ChatGPT 则能及时获得友好的回答，即使答案有可能是错误的。今天很多人都是询问 ChatGPT 而不是到 Stack Overflow 提问。在此背景下，Stack Overflow 宣布创建了一个专门讨论生成式 AI 提示词的社区 GenAI Stack Exchange，以及它的生成式 AI 工具 OverflowAI，帮助开发者找到编程问题的答案。它的预览版目前开放注册。

科技: ChatGPT 的编程问题错误率超过五成

Wilson(42865)

发表于2023年08月13日 23时35分星期日
来自猛兽的财富

普渡大学的研究人员发表了一篇论文预印本，他们用 517 个 Stack Overflow 问题测试了 OpenAI 的聊天机器人 ChatGPT，从正确性、一致性、全面性和简洁等方面对答案进行评估。他们还向 12 位人类参与者询问了 AI 生成的结果。他们的分析显示，ChatGPT 的结果有 52% 错误的，77% 太冗长。而人类只有在错误非常明显的情况下才能识别出来，他们在 39.34% 的情况下偏爱 ChatGPT 的答案，而这些答案中 77% 是错误的。即使答案明显错误，但因为其语言风格更令人感到愉快以及感到具有权威性，人类还是会青睐 AI 生成的答案。

科技: 在 AMD GPU 上编译和部署大模型

Wilson(42865)

发表于2023年08月11日 14时08分星期五
来自繁星若尘

今天的大模型主要用英伟达的 GPU 训练，但让英伟达一家独大对整个生态系统并不是好事。MLC（Machine learning compilation）项目正致力于在 AMD GPU 上编译和部署大模型，实现与英伟达 GPU 相当的性能。相对于英伟达深耕了近二十年的 CUDA 软件生态系统，AMD GPU 最大问题在于软件支持，它正通过投资 ROCm 缩小与英伟达的差距。MLC 是一项新兴技术，旨在编译和自动优化机器学习工作负载。它不会为每个后端如 ROCm 或 CUDA 构造特定的内核，而是自动为不同后端生成代码。开发者称，MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的八成，而 7900 XTX 的价格只有 RTX 4090 的六成。

科技: 中国互联网巨头订购了 50 亿美元的英伟达 GPU

Wilson(42865)

发表于2023年08月11日 13时39分星期五
来自泰坦棋手

FT 援引知情人士的消息报道，百度、字节跳动、腾讯和阿里巴巴今年从英伟达订购了价值 10 亿美元约 10 万张 A800 数据中心 GPU，额外加购的 40 亿美元英伟达 GPU 将在明年交付。A800 是弱化版的 A100 GPU，为了遵守美国去年颁布的出口限制，英伟达专为中国市场开发了降低数据传输率的 A800——A100 的传输率达到 800 GB/s，而 A800 降至了 600 GB/s。因为担心拜登政府颁布新的出口限制，中国互联网巨头疯狂囤积了英伟达的 A800 芯片。一位匿名百度员工说，没有英伟达的芯片，就没办法训练任何大语言模型。在 ChatGPT 大获成功之后，中国的互联网巨头都在开发自己的大模型。字节跳动开发的一个 AI 聊天机器人代号为 Grace，它为此已经囤积了约至少 1 万张英伟达 GPU，加购的约 7 万张 A800 将在明年交付，价值约 7 亿美元。

科技: Google 认为 AI 可以挖掘网上内容除非选择退出

Wilson(42865)

发表于2023年08月10日 19时38分星期四
来自失忆者

Google 就澳大利亚政府的 AI 监管框架递交文件表示，版权法应该修改允许生成式 AI 爬取互联网内容，让版权内容以恰当和合理使用的方式在澳大利亚用于训练 AI 模型，不愿意被训练的内容出版商可以选择退出。Google 最近提出了 robots.txt 的一种替代方案，网站可以在其中明确是否允许爬取内容训练 AI。AI 需要海量数据进行训练，而数据集的版权问题正日益引起关注。版权将是生成式 AI 未来面临的一大问题。

科技: Stability AI 宣布了它的 AI 编程助手 StableCode

Wilson(42865)

发表于2023年08月09日 23时29分星期三
来自盲点

AI 创业公司 Stability AI 宣布了它的 AI 编程助手 StableCode。StableCode 使用了三种不同的模型，基础模型首先使用了 BigCode 的 stack-dataset (v1.2)数据集训练，然后用流行编程语言如 Python、Go、Java、 Javascript、C、markdown 和 C++ 进一步训练。训练使用的总数据量达到了5600 亿 token。基础模型确定之后，指令模型用特定用例微调，以帮助解决复杂的编程任务。

科技: 阿里巴巴开源其大语言模型通义千问

Wilson(42865)

发表于2023年08月04日 17时58分星期五
来自寻找时间的人

阿里巴巴在今年四月宣布了它的大语言模型通义千问（Tongyi Qianwen 或简写 Qwen）。现在它宣布开源有 70 亿参数的 Qwen-7B 系列模型，源代码托管在 GitHub 上，采用被称为 Tongyi Qianwen LICENSE AGREEMENT 的许可证，有限制条件，如果商业使用，月活用户数超过 1 亿，则需要从阿里巴巴获得授权。这一条件与 Meta 对其 LLaMA 2 大模型的限制类似。阿里巴巴称，Qwen-7B是基于 Transformer 的大语言模型, 在 2.2 万亿 token 的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。相比同规模的开源模型，Qwen-7B 在多个评测数据集上具有显著优势，甚至超出 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等。

科技: IBM 和 NASA 开源最大地理空间 AI 基础模型

Wilson(42865)

发表于2023年08月03日 23时53分星期四
来自太阳系大乐透

IBM 和 Hugging Face 宣布开源最大的地理空间 AI 基础模型 watsonx.ai，使用 NASA 的卫星数据构建而成。模型由 IBM 和 NASA 使用 Harmonized Landsat Sentinel-2 项目在一年内对美国大陆的卫星观测数据进行训练，用洪水和火灾后迹地地图的标记数据进行微调。通过进一步的微调，该基础模型可重新部署用于跟踪森林砍伐、预测农作物产量、检测和监测温室气体等各种任务。

科技: 报名斯坦福庞博士“ChatGPT 和 LLM 系列课程”

亚历山大王(42382)

发表于2023年08月03日 19时49分星期四
来自盲点

无论是OpenAI的ChatGPT，还是Meta的Llama 2，AI正在颠覆整个世界。
在AI这片前景广阔的机遇之海中，席卷而来的是一阵阵变革风暴。
风暴围绕着科学家、创业者、投资者、行业专家，围绕着层出不穷的大模型，围绕着支撑经济发展的千行百业......甚至，AI风暴围绕着每一个普通人。
对于每一个人来说，与其被AI风暴颠覆，不如勇于直面风口。
现在，行行AI携手科技行者，推出斯坦福机器人庞博士“ChatGPT和LLM系列课程”，掌握大模型技能，学习大模型知识，欲购从速。

科技: 马斯克可能收购了 AI.com 域名

Wilson(42865)

发表于2023年08月03日 17时24分星期四
来自迷失的世界

索价 1100 万美元的高价值域名 AI.com 从今年 2 月开始重定向到 OpenAI 的 ChatGPT 网站，看起来是 OpenAI 收购了该域名。但本周它重定向了马斯克（Elon Musk）旗下的 AI 公司 xAI。域名代理商 Saw.com 此前曾宣布它参与了这次交易，但并没有透露买家是谁。AI.com 的 Whois 信息也没有给出任何答案。一种可能的解释是 OpenAI 收购了 AI.com，然后马斯克从 OpenAI 手中收购了 AI.com。Saw.com 和 xAI 目前尚未对此做出澄清。

科技: Meta 发布文本音乐生成开源 AI 工具 AudioCraft

Wilson(42865)

发表于2023年08月03日 11时59分星期四
来自伦敦场地

Meta 发布了一个开源 AI 工具 AudioCraft，允许用户通过文本提示生成音乐和音频。源代码托管在 GitHub 上，采用 MIT 许可证，模型权重采用 CC BY-NC-SA-4.0 授权，意味着商业使用受限。AudioCraft 包含了三个模型：MusicGen、AudioGen 和 EnCodec。其中 MusicGen 使用了 Meta 拥有的获得授权的音乐数据库训练，能从文本提示生成音乐；AudioGen 使用公共的音效库训练。

科技: Google Assistant 将加入生成式 AI 技术

Wilson(42865)

发表于2023年08月02日 19时22分星期三
来自2010：太空漫游

Google 计划对其智能助手 Assistant 进行大修，以加入类似 ChatGPT 和 Bard 的生成式 AI 技术。Google 称它对 Assistant 移动版本的修改工作已经启动。作为这一计划的一部分，Google 将会开始重组其 Assistant 团队，少许人会被裁掉。Assistant 团队有数千人，裁员只涉及数十个职位。

科技: Meta 的聊天机器人拥有林肯的人格特质

Wilson(42865)

发表于2023年08月02日 15时45分星期三
来自八十天环游地球

Meta 准备推出的 AI 聊天机器人将拥有独特人格，包括冲浪者人格和林肯（Abraham Lincoln）人格。Meta 此举旨在提高其平台上的互动性，因为相比毫无感情特色的 AI 机器人回复，具有类似人类特征的讨论会更有趣。Meta 尚未宣布旗下哪些产品会加入 AI 聊天机器人。可能包括 Instagram、Messenger 和 WhatsApp。该功能预计最早会在 9 月推出。聊天机器人能收集大量用户个人信息，而 Meta 的收入大部分来自广告，它等着你与林肯先生分享你的喜好。

科技: 香港大学拥抱 ChatGPT

Wilson(42865)

发表于2023年08月02日 13时40分星期三
来自机器人的逃跑计划

香港众多高校拥抱了 OpenAI 的聊天机器人 ChatGPT。香港科技大学率先引入ChatGPT。6 月 1 日它正式为学生与教职人员提供港科大版 ChatGPT，是香港首所为学生与教职工提供 ChatGPT 的大学。香港中文大学、香港理工大学、香港浸会大学等高校也陆续推出使用 AI 工具的指引，共同希望师生批判性探索和谨慎使用 AI，保障学术诚信。除了在高等教育掀起热潮，AI 也将进入香港的初中课堂。香港教育局 6 月 19 日推出初中 AI 课程教材，介绍 ChatGPT 等前沿的生成式 AI，近一半内容重点关注 AI 的伦理与社会影响。该局指出，ChatGPT 可以成为有价值的教育工具，但要留意抄袭的伦理问题，并期望所有公立中学尽快规划，于 2023/24 学年在“资讯和通讯科技课程”中安排 10 至 14 小时的 AI 课程教授。