算子简报

2025-03-28 · 算子简报

1

阿里巴巴推出全新视觉推理模型QVQ-Max

阿里巴巴的AI研究团队Qwen发布了视觉推理模型QVQ-Max,标志着AI技术的重大突破。

该模型能够处理图片和视频,并进行深入的多模态推理,广泛应用于教育、编程和艺术创作等领域。

用户可以通过Qwen Chat平台免费试用QVQ-Max,初步反馈显示其推理速度和准确性良好。

2

快手可灵AI平台全面升级,推出新功能

快手旗下的可灵AI平台进行了全面升级,优化了视觉体系和交互体验。

此次更新新增了“AI音效”和“资产管理”功能,旨在提升创作者的创意素材生产与管理效率。

可灵AI平台采用极简主义设计,新的Logo简洁现代,减少视觉干扰,突出创意表现。

3

ChatGPT迎来重大升级,推出全新记忆功能

OpenAI于3月27日推出了新版GPT-4o模型及全新记忆功能Moonshine Nux V2。

此次升级显著提升了模型在理解复杂指令和多任务处理方面的表现,竞技场排名跃升至第二。

记忆功能的引入使得ChatGPT能够跨越对话保持连贯性,为用户提供更加智能的交互体验。

4

Cline支持Gemini 2.5 Pro,助力AI开发

Cline作为一款AI辅助开发工具,现已支持Google DeepMind推出的Gemini 2.5 Pro模型。

这一更新提升了开发效率,引发了开发者社区的热烈讨论,带来了新的编码和调试可能性。

Gemini 2.5 Pro凭借其卓越的多模态能力和长上下文处理能力,为开发者提供了强大支持。

5

豆包推出新版深度思考功能,支持边想边搜

字节跳动旗下的AI助手豆包于3月28日推出新版深度思考功能,开启测试阶段。

这一功能提升了AI助手的信息处理和推理能力,用户可以在思考的同时进行信息搜索。

豆包能够在旅游规划和专业写作中提供更完善的方案和参考思路。

6

OpenAI升级GPT-4o,付费用户即刻体验

OpenAI宣布其旗舰模型GPT-4o迎来新一轮升级,付费用户可立即体验新功能。

此次升级显著提升了模型在复杂指令处理、技术与编程能力及直觉与创造力方面的表现。

免费用户需等待数周才能体验新功能,旨在增强模型的实用性和人性化。

7

Midjourney V7即将发布,重新定义AI生成艺术

Midjourney V7将于3月31日发布,标志着AI生成艺术领域的重大飞跃。

新版本在图像生成能力上展现出卓越的进步,特别是在自然语言理解方面。

用户将能够通过简单文字生成复杂艺术作品,巩固Midjourney在AI驱动创意工具领域的领导地位。

8

OpenAI推出新功能,ChatGPT可连接企业知识库

OpenAI最近推出了一项新功能,ChatGPT Team用户能够直接连接企业内部知识库。

这一功能将提升企业用户的工作效率和决策质量,确保回答与最新的企业语境相符。

当前支持的主要数据连接为Google Drive,未来将扩展至更多数据源。

9

PIKA发布新功能,用户可见年轻的自己

AI视频生成平台iPIKA推出新功能“您可以遇见更年轻的自己”。

用户通过上传童年照片和自拍视频生成与年轻版自己的互动视频。

该功能展现了iPIKA在视频生成领域的技术实力,迅速在用户中流行。

10

Nvidia推出G-Assist,为玩家提供全方位支持

Nvidia推出了其实验性AI助手G-Assist,旨在为使用GeForce RTX显卡的玩家提供本地化支持。

G-Assist依赖用户的GPU进行处理,具备系统诊断、游戏优化和性能监控等功能。

该助手鼓励用户反馈,持续完善其功能,提升玩家体验。

11

开源版Suno发布,AI音乐生成模型YuE上线

YuE是由香港科技大学与DeepSeek合作开发的开源音乐生成模型。

该模型能够生成多种风格的音乐并模拟人声,提升了音乐生成的质量。

YuE的结构化渐进生成技术提高了歌曲连贯性,避免抄袭,增强创作独特性。

12

Manus推出付费计划,Starter套餐定价39美元

Manus宣布推出其首个付费订阅模式,标志着平台向商业化运营的重要转型。

公司推出了两个不同级别的订阅计划:Starter和Pro,同时保留了1,000积分的免费额度。

Starter套餐提供3,900月度积分,支持同时运行两个任务,并享有高峰时段优先访问权限。