算子简报
2025-03-28 · 算子简报
阿里巴巴推出全新视觉推理模型QVQ-Max
•阿里巴巴的AI研究团队Qwen发布了视觉推理模型QVQ-Max,标志着AI技术的重大突破。
•该模型能够处理图片和视频,并进行深入的多模态推理,广泛应用于教育、编程和艺术创作等领域。
•用户可以通过Qwen Chat平台免费试用QVQ-Max,初步反馈显示其推理速度和准确性良好。
快手可灵AI平台全面升级,推出新功能
•快手旗下的可灵AI平台进行了全面升级,优化了视觉体系和交互体验。
•此次更新新增了“AI音效”和“资产管理”功能,旨在提升创作者的创意素材生产与管理效率。
•可灵AI平台采用极简主义设计,新的Logo简洁现代,减少视觉干扰,突出创意表现。
ChatGPT迎来重大升级,推出全新记忆功能
•OpenAI于3月27日推出了新版GPT-4o模型及全新记忆功能Moonshine Nux V2。
•此次升级显著提升了模型在理解复杂指令和多任务处理方面的表现,竞技场排名跃升至第二。
•记忆功能的引入使得ChatGPT能够跨越对话保持连贯性,为用户提供更加智能的交互体验。
Cline支持Gemini 2.5 Pro,助力AI开发
•Cline作为一款AI辅助开发工具,现已支持Google DeepMind推出的Gemini 2.5 Pro模型。
•这一更新提升了开发效率,引发了开发者社区的热烈讨论,带来了新的编码和调试可能性。
•Gemini 2.5 Pro凭借其卓越的多模态能力和长上下文处理能力,为开发者提供了强大支持。
豆包推出新版深度思考功能,支持边想边搜
•字节跳动旗下的AI助手豆包于3月28日推出新版深度思考功能,开启测试阶段。
•这一功能提升了AI助手的信息处理和推理能力,用户可以在思考的同时进行信息搜索。
•豆包能够在旅游规划和专业写作中提供更完善的方案和参考思路。
OpenAI升级GPT-4o,付费用户即刻体验
•OpenAI宣布其旗舰模型GPT-4o迎来新一轮升级,付费用户可立即体验新功能。
•此次升级显著提升了模型在复杂指令处理、技术与编程能力及直觉与创造力方面的表现。
•免费用户需等待数周才能体验新功能,旨在增强模型的实用性和人性化。
Midjourney V7即将发布,重新定义AI生成艺术
•Midjourney V7将于3月31日发布,标志着AI生成艺术领域的重大飞跃。
•新版本在图像生成能力上展现出卓越的进步,特别是在自然语言理解方面。
•用户将能够通过简单文字生成复杂艺术作品,巩固Midjourney在AI驱动创意工具领域的领导地位。
OpenAI推出新功能,ChatGPT可连接企业知识库
•OpenAI最近推出了一项新功能,ChatGPT Team用户能够直接连接企业内部知识库。
•这一功能将提升企业用户的工作效率和决策质量,确保回答与最新的企业语境相符。
•当前支持的主要数据连接为Google Drive,未来将扩展至更多数据源。
PIKA发布新功能,用户可见年轻的自己
•AI视频生成平台iPIKA推出新功能“您可以遇见更年轻的自己”。
•用户通过上传童年照片和自拍视频生成与年轻版自己的互动视频。
•该功能展现了iPIKA在视频生成领域的技术实力,迅速在用户中流行。
Nvidia推出G-Assist,为玩家提供全方位支持
•Nvidia推出了其实验性AI助手G-Assist,旨在为使用GeForce RTX显卡的玩家提供本地化支持。
•G-Assist依赖用户的GPU进行处理,具备系统诊断、游戏优化和性能监控等功能。
•该助手鼓励用户反馈,持续完善其功能,提升玩家体验。
开源版Suno发布,AI音乐生成模型YuE上线
•YuE是由香港科技大学与DeepSeek合作开发的开源音乐生成模型。
•该模型能够生成多种风格的音乐并模拟人声,提升了音乐生成的质量。
•YuE的结构化渐进生成技术提高了歌曲连贯性,避免抄袭,增强创作独特性。
Manus推出付费计划,Starter套餐定价39美元
•Manus宣布推出其首个付费订阅模式,标志着平台向商业化运营的重要转型。
•公司推出了两个不同级别的订阅计划:Starter和Pro,同时保留了1,000积分的免费额度。
•Starter套餐提供3,900月度积分,支持同时运行两个任务,并享有高峰时段优先访问权限。