算子简报

2025-03-19 · 算子简报

1

昆仑万维发布开源视觉推理模型Skywork R1V

昆仑万维推出全球首个开源多模态推理模型Skywork R1V,具有38亿参数。

该模型在视觉问答和复杂推理任务中表现优异,特别是在MMMU和MathVista基准测试中取得高分。

Skywork R1V的发布旨在推动技术共享,助力全球AI开源社区的发展。

详情链接
2

豆包AI编程功能升级,新增HTML预览等三大功能

豆包AI对其编程功能进行了重要升级,新增HTML实时预览、Python代码直接运行等功能。

用户可以更直观地开发网页和小游戏,并快速修复Python代码错误。

新功能旨在简化开发流程,提高用户的编程效率和体验。

详情链接
3

Google Gemini推出新功能提升用户协作体验

Google推出Gemini的新功能“Canvas”,旨在提升用户的创作和协作体验。

该功能允许用户实时编辑和分享写作与编程项目,提供更高效的协作方式。

音频概览功能的引入使用户能够生成文档的音频摘要,方便分享和下载。

4

Cursor发布Claude Max,重塑AI编程格局

Cursor推出的Claude Max模型具备卓越的性能,能够处理高达20万字的内容。

该模型显著提升了编程效率,支持多达200次工具调用。

Claude Max的按使用量计费模式适合处理复杂项目的高级用户。

5

Adobe推出10个AI智能体,助力客户创建个人网站

Adobe推出10个全新的AI智能体,涵盖客户互动、内容生产等多个领域。

新功能Brand Concierge提供个性化的网站访问体验,增强客户的参与度和忠诚度。

这些智能体协同作战,帮助企业更有效地管理客户关系。

6

字节跳动豆包团队召开全员会,探索AI新高度

字节跳动的豆包大模型团队召开全员会议,明确未来发展方向。

会议强调探索智能上限的重要性,鼓励团队成员参与具有挑战性的研究。

团队计划增加对Seed Edge项目的资源投入,以吸引和培养顶尖人才。

7

Stability AI发布Stable Virtual Camera,轻松将2D照片转为3D视频

Stability AI推出的Stable Virtual Camera能够将2D图像转换为沉浸式视频。

该模型支持用户从一张或多张图像中生成新视角,并指定相机角度。

当前版本为研究预览版,可能在特定场景下出现质量下降的风险。

详情链接
8

Nvidia发布两款个人AI超级计算机,计算能力惊人

Nvidia发布的DGX Spark和DGX Station具备每秒高达1000万亿次的AI计算能力。

这两款设备为边缘计算领域的创新提供了新的可能性。

DGX Station搭载784GB内存,提供卓越的桌面计算体验。

9

Nvidia推出Dynamo软件,提升DeepSeek AI速度

Nvidia宣布推出Dynamo软件,计划将DeepSeek的AI处理速度提升30倍。

Dynamo能够将AI推理任务分配到多达1000个GPU上并行处理,显著提升查询吞吐量。

此举旨在帮助服务提供商更高效地处理客户查询,提高整体收入。

10

Grok上线DeeperSearch功能,提升AI资讯检索能力

xAI推出的Grok新增DeeperSearch功能,显著提升实时检索AI资讯的能力。

该功能能够快速分析过去48小时内的热点话题,用户反馈积极。

Grok的升级在信息流速极高的社交媒体上表现突出,展现出独特的潜力。