算子简报

2025-04-09 · 算子简报

1

阿里巴巴与腾讯共同支持MCP协议,推动AI标准化进程

阿里巴巴宣布全面支持Model Context Protocol(MCP)协议,标志着中国AI生态的标准化进程。

腾讯紧随其后,表明中国科技巨头在全球AI标准竞争中的新一轮角力。

MCP协议的快速崛起凸显了中国科技企业对标准化协议的迫切需求。

2

阶跃星辰推出新多模态推理模型Step-R1-V-Mini

Step-R1-V-Mini是一个支持图文输入和文字输出的创新多模态推理模型。

该模型在视觉推理和数学逻辑方面表现优异,尤其在MathVision视觉推理榜单中名列前茅。

通过多模态联合强化学习和verifiable reward机制,提升了模型的指令遵循能力和通用性。

3

美图WHEE发布图像生成模型Miracle F1,革新AI图像创作

Miracle F1以卓越的图像生成质量和对复杂概念的深刻理解,革新了AI图像创作领域。

该模型不仅能生成真实感极强的图像,还在语义理解和风格多样性方面表现出色。

用户可以通过WHEE官方网站体验这一视觉魔法。

4

Deep Research推出Gemini 2.5 Pro,谷歌最智能AI模型闪耀登场

谷歌宣布Deep Research功能升级至Gemini 2.5 Pro实验版,展现出卓越的推理能力。

这一技术突破引发行业广泛关注,标志着AI研究工具的重要里程碑。

Gemini 2.5 Pro在多个基准测试中表现卓越,尤其在长上下文任务中具备高达100万token的上下文窗口。

5

开源新模型DeepCoder超越OpenAI o1,展现强大潜力

DeepCoder-14B-Preview模型由Together AI和Agentica联合开源,凭借140亿参数在编程测试中表现出色。

该模型的开源内容丰富,包括模型权重、训练数据和训练方法,方便开发者深入研究。

通过分布式强化学习和高质量的数据集,DeepCoder在训练效率和代码质量上均有显著提升。

详情链接
6

DeepSeek推出SPCT技术,提升AI推理性能

DeepSeek推出的自主演原则批判调优技术(SPCT)标志着在大型语言模型领域的一次重大突破。

该技术旨在构建更通用和可扩展的AI奖励模型,提升AI在复杂环境中的理解与应对能力。

SPCT有效提高了AI在复杂任务中的表现和推理能力。

7

Anthropic发布大学生Claude AI使用报告,揭示AI在学习中的应用

该报告探讨了AI在大学生学习中的应用,特别是Claude.ai的使用情况。

研究揭示了不同专业学生对AI的使用偏好,以及AI在学习中的角色。

STEM专业学生是AI工具的早期采用者,尤其是计算机科学专业的使用率显著高于其他专业。

8

亚马逊推出新一代AI语音模型Nova Sonic,提升语音助手性能

Nova Sonic旨在提升亚马逊语音助手Alexa +的性能,标志着语音识别技术的重大突破。

该模型通过本地处理语音,能够生成自然流畅的回复,提升用户体验。

Nova Sonic的成本比OpenAI的GPT-4o低80%,为开发者提供更多选择。

详情链接
9

谷歌NotebookLM即将推出移动应用程序版本,扩展用户体验

NotebookLM即将推出独立的移动客户端应用程序,标志着其从网页端向移动端的扩展。

这一升级将为用户提供更便捷的使用体验,满足对移动应用的需求。

新增“Discover Sources”功能,允许用户自动搜索并整合网页内容至笔记本。

10

AI视频生成技术TTT实现新突破,生成完整动画无需编辑

TTT技术通过引入测试时训练层,成功生成了一分钟的《猫和老鼠》动画视频。

该技术在画面连贯性和故事完整性上表现出色,且无需后期编辑,展现了AI在创意内容生产中的巨大潜力。

未来可扩展至更复杂的内容,降低视频制作成本,加速创意流程。

详情链接
11

网信办发布生成式AI服务备案情况,346款服务已完成备案

截至2025年3月31日,346款生成式人工智能服务已在国家网信办完成备案。

所有上线应用需公示所用的已备案服务信息,包括模型名称和备案号。

这一举措旨在促进生成式AI领域的创新和规范应用。

12

英伟达发布Llama3.1Nemotron Ultra253B,性能超越Llama4

英伟达推出Llama3.1Nemotron Ultra253B模型,性能超越Llama4系列。

该模型在Hugging Face平台开源,具备商业友好特性。

Llama3.1Nemotron Ultra253B拥有2530亿参数,优化架构降低内存占用,适合高效推理。

详情链接