算子简报
2025-04-09 · 算子简报
阿里巴巴与腾讯共同支持MCP协议,推动AI标准化进程
•阿里巴巴宣布全面支持Model Context Protocol(MCP)协议,标志着中国AI生态的标准化进程。
•腾讯紧随其后,表明中国科技巨头在全球AI标准竞争中的新一轮角力。
•MCP协议的快速崛起凸显了中国科技企业对标准化协议的迫切需求。
阶跃星辰推出新多模态推理模型Step-R1-V-Mini
•Step-R1-V-Mini是一个支持图文输入和文字输出的创新多模态推理模型。
•该模型在视觉推理和数学逻辑方面表现优异,尤其在MathVision视觉推理榜单中名列前茅。
•通过多模态联合强化学习和verifiable reward机制,提升了模型的指令遵循能力和通用性。
美图WHEE发布图像生成模型Miracle F1,革新AI图像创作
•Miracle F1以卓越的图像生成质量和对复杂概念的深刻理解,革新了AI图像创作领域。
•该模型不仅能生成真实感极强的图像,还在语义理解和风格多样性方面表现出色。
•用户可以通过WHEE官方网站体验这一视觉魔法。
Deep Research推出Gemini 2.5 Pro,谷歌最智能AI模型闪耀登场
•谷歌宣布Deep Research功能升级至Gemini 2.5 Pro实验版,展现出卓越的推理能力。
•这一技术突破引发行业广泛关注,标志着AI研究工具的重要里程碑。
•Gemini 2.5 Pro在多个基准测试中表现卓越,尤其在长上下文任务中具备高达100万token的上下文窗口。
开源新模型DeepCoder超越OpenAI o1,展现强大潜力
•DeepCoder-14B-Preview模型由Together AI和Agentica联合开源,凭借140亿参数在编程测试中表现出色。
•该模型的开源内容丰富,包括模型权重、训练数据和训练方法,方便开发者深入研究。
•通过分布式强化学习和高质量的数据集,DeepCoder在训练效率和代码质量上均有显著提升。
DeepSeek推出SPCT技术,提升AI推理性能
•DeepSeek推出的自主演原则批判调优技术(SPCT)标志着在大型语言模型领域的一次重大突破。
•该技术旨在构建更通用和可扩展的AI奖励模型,提升AI在复杂环境中的理解与应对能力。
•SPCT有效提高了AI在复杂任务中的表现和推理能力。
Anthropic发布大学生Claude AI使用报告,揭示AI在学习中的应用
•该报告探讨了AI在大学生学习中的应用,特别是Claude.ai的使用情况。
•研究揭示了不同专业学生对AI的使用偏好,以及AI在学习中的角色。
•STEM专业学生是AI工具的早期采用者,尤其是计算机科学专业的使用率显著高于其他专业。
亚马逊推出新一代AI语音模型Nova Sonic,提升语音助手性能
•Nova Sonic旨在提升亚马逊语音助手Alexa +的性能,标志着语音识别技术的重大突破。
•该模型通过本地处理语音,能够生成自然流畅的回复,提升用户体验。
•Nova Sonic的成本比OpenAI的GPT-4o低80%,为开发者提供更多选择。
谷歌NotebookLM即将推出移动应用程序版本,扩展用户体验
•NotebookLM即将推出独立的移动客户端应用程序,标志着其从网页端向移动端的扩展。
•这一升级将为用户提供更便捷的使用体验,满足对移动应用的需求。
•新增“Discover Sources”功能,允许用户自动搜索并整合网页内容至笔记本。
AI视频生成技术TTT实现新突破,生成完整动画无需编辑
•TTT技术通过引入测试时训练层,成功生成了一分钟的《猫和老鼠》动画视频。
•该技术在画面连贯性和故事完整性上表现出色,且无需后期编辑,展现了AI在创意内容生产中的巨大潜力。
•未来可扩展至更复杂的内容,降低视频制作成本,加速创意流程。
网信办发布生成式AI服务备案情况,346款服务已完成备案
•截至2025年3月31日,346款生成式人工智能服务已在国家网信办完成备案。
•所有上线应用需公示所用的已备案服务信息,包括模型名称和备案号。
•这一举措旨在促进生成式AI领域的创新和规范应用。
英伟达发布Llama3.1Nemotron Ultra253B,性能超越Llama4
•英伟达推出Llama3.1Nemotron Ultra253B模型,性能超越Llama4系列。
•该模型在Hugging Face平台开源,具备商业友好特性。
•Llama3.1Nemotron Ultra253B拥有2530亿参数,优化架构降低内存占用,适合高效推理。