算子简报

2025-03-28 · 算子简报

阿里巴巴推出全新视觉推理模型QVQ-Max

•阿里巴巴的AI研究团队Qwen发布了视觉推理模型QVQ-Max，标志着AI技术的重大突破。

•该模型能够处理图片和视频，并进行深入的多模态推理，广泛应用于教育、编程和艺术创作等领域。

•用户可以通过Qwen Chat平台免费试用QVQ-Max，初步反馈显示其推理速度和准确性良好。

快手可灵AI平台全面升级，推出新功能

•快手旗下的可灵AI平台进行了全面升级，优化了视觉体系和交互体验。

•此次更新新增了“AI音效”和“资产管理”功能，旨在提升创作者的创意素材生产与管理效率。

•可灵AI平台采用极简主义设计，新的Logo简洁现代，减少视觉干扰，突出创意表现。

ChatGPT迎来重大升级，推出全新记忆功能

•OpenAI于3月27日推出了新版GPT-4o模型及全新记忆功能Moonshine Nux V2。

•此次升级显著提升了模型在理解复杂指令和多任务处理方面的表现，竞技场排名跃升至第二。

•记忆功能的引入使得ChatGPT能够跨越对话保持连贯性，为用户提供更加智能的交互体验。

Cline支持Gemini 2.5 Pro，助力AI开发

•Cline作为一款AI辅助开发工具，现已支持Google DeepMind推出的Gemini 2.5 Pro模型。

•这一更新提升了开发效率，引发了开发者社区的热烈讨论，带来了新的编码和调试可能性。

•Gemini 2.5 Pro凭借其卓越的多模态能力和长上下文处理能力，为开发者提供了强大支持。

豆包推出新版深度思考功能，支持边想边搜

•字节跳动旗下的AI助手豆包于3月28日推出新版深度思考功能，开启测试阶段。

•这一功能提升了AI助手的信息处理和推理能力，用户可以在思考的同时进行信息搜索。

•豆包能够在旅游规划和专业写作中提供更完善的方案和参考思路。

OpenAI升级GPT-4o，付费用户即刻体验

•OpenAI宣布其旗舰模型GPT-4o迎来新一轮升级，付费用户可立即体验新功能。

•此次升级显著提升了模型在复杂指令处理、技术与编程能力及直觉与创造力方面的表现。

•免费用户需等待数周才能体验新功能，旨在增强模型的实用性和人性化。

Midjourney V7即将发布，重新定义AI生成艺术

•Midjourney V7将于3月31日发布，标志着AI生成艺术领域的重大飞跃。

•新版本在图像生成能力上展现出卓越的进步，特别是在自然语言理解方面。

•用户将能够通过简单文字生成复杂艺术作品，巩固Midjourney在AI驱动创意工具领域的领导地位。

OpenAI推出新功能，ChatGPT可连接企业知识库

•OpenAI最近推出了一项新功能，ChatGPT Team用户能够直接连接企业内部知识库。

•这一功能将提升企业用户的工作效率和决策质量，确保回答与最新的企业语境相符。

•当前支持的主要数据连接为Google Drive，未来将扩展至更多数据源。

PIKA发布新功能，用户可见年轻的自己

•AI视频生成平台iPIKA推出新功能“您可以遇见更年轻的自己”。

•用户通过上传童年照片和自拍视频生成与年轻版自己的互动视频。

•该功能展现了iPIKA在视频生成领域的技术实力，迅速在用户中流行。

Nvidia推出G-Assist，为玩家提供全方位支持

•Nvidia推出了其实验性AI助手G-Assist，旨在为使用GeForce RTX显卡的玩家提供本地化支持。

•G-Assist依赖用户的GPU进行处理，具备系统诊断、游戏优化和性能监控等功能。

•该助手鼓励用户反馈，持续完善其功能，提升玩家体验。

开源版Suno发布，AI音乐生成模型YuE上线

•YuE是由香港科技大学与DeepSeek合作开发的开源音乐生成模型。

•该模型能够生成多种风格的音乐并模拟人声，提升了音乐生成的质量。

•YuE的结构化渐进生成技术提高了歌曲连贯性，避免抄袭，增强创作独特性。

Manus推出付费计划，Starter套餐定价39美元

•Manus宣布推出其首个付费订阅模式，标志着平台向商业化运营的重要转型。

•公司推出了两个不同级别的订阅计划:Starter和Pro，同时保留了1,000积分的免费额度。

•Starter套餐提供3,900月度积分，支持同时运行两个任务，并享有高峰时段优先访问权限。