算子简报

2025-04-09 · 算子简报

阿里巴巴与腾讯共同支持MCP协议，推动AI标准化进程

•阿里巴巴宣布全面支持Model Context Protocol（MCP）协议，标志着中国AI生态的标准化进程。

•腾讯紧随其后，表明中国科技巨头在全球AI标准竞争中的新一轮角力。

•MCP协议的快速崛起凸显了中国科技企业对标准化协议的迫切需求。

阶跃星辰推出新多模态推理模型Step-R1-V-Mini

•Step-R1-V-Mini是一个支持图文输入和文字输出的创新多模态推理模型。

•该模型在视觉推理和数学逻辑方面表现优异，尤其在MathVision视觉推理榜单中名列前茅。

•通过多模态联合强化学习和verifiable reward机制，提升了模型的指令遵循能力和通用性。

美图WHEE发布图像生成模型Miracle F1，革新AI图像创作

•Miracle F1以卓越的图像生成质量和对复杂概念的深刻理解，革新了AI图像创作领域。

•该模型不仅能生成真实感极强的图像，还在语义理解和风格多样性方面表现出色。

•用户可以通过WHEE官方网站体验这一视觉魔法。

Deep Research推出Gemini 2.5 Pro，谷歌最智能AI模型闪耀登场

•谷歌宣布Deep Research功能升级至Gemini 2.5 Pro实验版，展现出卓越的推理能力。

•这一技术突破引发行业广泛关注，标志着AI研究工具的重要里程碑。

•Gemini 2.5 Pro在多个基准测试中表现卓越，尤其在长上下文任务中具备高达100万token的上下文窗口。

开源新模型DeepCoder超越OpenAI o1，展现强大潜力

•DeepCoder-14B-Preview模型由Together AI和Agentica联合开源，凭借140亿参数在编程测试中表现出色。

•该模型的开源内容丰富，包括模型权重、训练数据和训练方法，方便开发者深入研究。

•通过分布式强化学习和高质量的数据集，DeepCoder在训练效率和代码质量上均有显著提升。

详情链接

DeepSeek推出SPCT技术，提升AI推理性能

•DeepSeek推出的自主演原则批判调优技术（SPCT）标志着在大型语言模型领域的一次重大突破。

•该技术旨在构建更通用和可扩展的AI奖励模型，提升AI在复杂环境中的理解与应对能力。

•SPCT有效提高了AI在复杂任务中的表现和推理能力。

Anthropic发布大学生Claude AI使用报告，揭示AI在学习中的应用

•该报告探讨了AI在大学生学习中的应用，特别是Claude.ai的使用情况。

•研究揭示了不同专业学生对AI的使用偏好，以及AI在学习中的角色。

•STEM专业学生是AI工具的早期采用者，尤其是计算机科学专业的使用率显著高于其他专业。

亚马逊推出新一代AI语音模型Nova Sonic，提升语音助手性能

•Nova Sonic旨在提升亚马逊语音助手Alexa +的性能，标志着语音识别技术的重大突破。

•该模型通过本地处理语音，能够生成自然流畅的回复，提升用户体验。

•Nova Sonic的成本比OpenAI的GPT-4o低80%，为开发者提供更多选择。

详情链接

谷歌NotebookLM即将推出移动应用程序版本，扩展用户体验

•NotebookLM即将推出独立的移动客户端应用程序，标志着其从网页端向移动端的扩展。

•这一升级将为用户提供更便捷的使用体验，满足对移动应用的需求。

•新增“Discover Sources”功能，允许用户自动搜索并整合网页内容至笔记本。

AI视频生成技术TTT实现新突破，生成完整动画无需编辑

•TTT技术通过引入测试时训练层，成功生成了一分钟的《猫和老鼠》动画视频。

•该技术在画面连贯性和故事完整性上表现出色，且无需后期编辑，展现了AI在创意内容生产中的巨大潜力。

•未来可扩展至更复杂的内容，降低视频制作成本，加速创意流程。

详情链接

网信办发布生成式AI服务备案情况，346款服务已完成备案

•截至2025年3月31日，346款生成式人工智能服务已在国家网信办完成备案。

•所有上线应用需公示所用的已备案服务信息，包括模型名称和备案号。

•这一举措旨在促进生成式AI领域的创新和规范应用。

英伟达发布Llama3.1Nemotron Ultra253B，性能超越Llama4

•英伟达推出Llama3.1Nemotron Ultra253B模型，性能超越Llama4系列。

•该模型在Hugging Face平台开源，具备商业友好特性。

•Llama3.1Nemotron Ultra253B拥有2530亿参数，优化架构降低内存占用，适合高效推理。

详情链接