算子简报

2025-02-25 · 算子简报

1

Anthropic推出Claude 3.7 Sonnet混合推理模型,超越DeepSeek

Anthropic宣布推出其最新的混合推理模型Claude 3.7 Sonnet,声称其为史上最智能的AI模型。

该模型结合推理模式与传统模式,能够高效处理复杂问题并保持快速响应。

同时发布的Claude Code编程工具进一步拓展了Claude系列的应用。

2

阿里通义千问发布QwQ-Max推理模型预览版

阿里巴巴推出基于Qwen2.5-Max的推理模型QwQ-Max-Preview,并计划全面开源。

这一举措将推动AI技术的普及,为开发者和企业提供更强大的推理能力。

QwQ-Max在代码生成和复杂任务处理方面表现优异。

3

DeepSeek开源周推出首个MoE模型的EP通信库

DeepSeek在开源周的第二天推出了DeepEP,这是一个专为混合专家模型设计的高效通信库。

该库支持低延迟和高吞吐量的多对多GPU内核,适合训练和推理任务。

DeepEP兼容FP8等低精度操作,并优化了数据转发的带宽性能。

4

拼多多组建电商推荐大模型团队,年薪显著提升

拼多多宣布组建电商推荐大模型团队,负责人年薪数倍于百度时期。

团队专注于优化用户体验和提升交易效率,采用赛马机制激励技术迭代。

目标是挑战阿里和京东的市场地位。

5

Cursor AI集成Claude 3.7 Sonnet推理模型

Cursor AI近期宣布集成Claude 3.7 Sonnet推理模型,并更新了用户界面。

Claude 3.7 Sonnet结合快速回答与深度思考,适用于复杂任务。

在编程测试中,Sonnet表现突出,领先其他知名模型。

6

ChatGPT新增Safari扩展功能,提升搜索体验

OpenAI推出了ChatGPT应用的新版本,新增Safari浏览器的扩展功能。

用户可以将ChatGPT设置为默认搜索引擎,提升信息检索的智能化和个性化。

这一更新旨在增强用户的搜索体验。

7

商汤小浣熊家族全面升级,强化多模态能力

商汤科技在2025全球开发者先锋大会上宣布小浣熊家族的全面升级。

此次升级提升了工具的性能,使AI更好地服务于生产力。

新版本支持多模态能力,推动AI应用加速落地。

8

Anthropic融资金额或增至35亿美元,估值达615亿美元

Anthropic正在进行一轮新的融资,融资规模从20亿美元增至35亿美元。

尽管年化收入约为12亿美元,Anthropic仍处于亏损状态。

计划利用此次融资加大对AI技术研发的投入。

9

百度教育接入DeepSeek-R1模型,提升学习工具智能化

百度宣布其教育产品“拍照搜题”和“AI写作文”正式接入DeepSeek-R1模型。

这一接入提升了学习工具的智能化水平,提供更高效的学习体验。

帮助用户掌握解题方法和写作技巧。

10

京东发布京点点AIGC内容生成平台,助力电商内容生成

京东零售技术团队推出的京点点AIGC内容生成平台,实现电商内容生成的重大突破。

该平台帮助商家高效、低成本地生成商品图片和营销文案。

日均调用量超过1000万次,覆盖20多个核心场景。

11

DeepSeek API充值服务恢复,用户可重新充值

DeepSeek API开放平台宣布其充值服务已恢复,之前因资源紧张暂停。

此次恢复后模型的调用价格有所调整,用户需关注新标准。

合理安排充值与使用计划,以适应新的价格标准。

12

Pika推出新工具Pikaswaps,精确替换视频内容

Pika公司推出的新工具“Pikaswaps”允许用户精确替换视频中的特定内容。

该工具展示了AI视频编辑技术的显著进步,受到行业和用户的广泛关注。

未来,Pika将继续优化这一技术,并可能发布更多创新功能。