算子简报

2025-05-14 · 算子简报

1

腾讯推出全新AI编程助手CodeBuddy 3.0

腾讯发布了与微信小程序开发工具深度整合的CodeBuddy 3.0插件。

该插件支持代码补全和智能提示功能,旨在提升开发效率。

CodeBuddy 3.0的设计允许开发者在不更换开发环境的情况下使用多种开发工具。

2

字节跳动发布Seed1.5-VL多模态模型,参数仅20B

字节跳动推出的Seed1.5-VL模型在38项任务上达到了SOTA水平。

该模型支持视频理解等多种任务,且推理成本低。

开发者可以通过火山引擎API快速调用该模型,构建AI视觉助手。

3

通义千问Qwen上线Deep Research功能,助力科研

Qwen团队推出的“Deep Research”智能助理系统可梳理复杂问题并生成研究报告。

该功能旨在提升科研效率,并提供免费开放体验。

Deep Research适用于科研人员和普通用户,能够整合网络信息。

4

蝴蝶效应公司否认融资传闻,专注产品研发

蝴蝶效应公司发布声明,否认关于其以15亿美元估值融资的传闻。

公司强调消息“严重失实”,并表示将专注于产品研发。

声明中提到,融资信息将通过官方渠道发布。

5

Devv2.0进入Private Beta阶段,全面升级开发者工具

Devv2.0从AI搜索引擎转型为开发者生产力工具,覆盖开发周期的更多环节。

新版本支持生成式AI模型生成代码,提升开发效率。

Private Beta阶段邀请社区反馈,以优化产品。

6

苹果推出Matrix3D模型,简化3D建模流程

Matrix3D模型能够从少量2D照片生成高质量3D场景。

该技术整合多个处理步骤,提高效率并减少人为错误。

Matrix3D为沉浸式技术应用提供了新的潜力,推动元宇宙发展。

7

Anthropic即将发布Claude Neptune,注重用户安全

Anthropic的新模型Claude Neptune正在进行内部安全测试,预计在5月底或6月初发布。

该模型将与GPT-5等竞争,重点防范越狱攻击。

Claude Neptune设计注重用户安全和隐私,提升AI系统的稳定性。

8

清华大学与面壁智能推出AgentCPM-GUI,支持中英文操作

AgentCPM-GUI基于MiniCPM-V模型,覆盖30多个主流中文APP。

该系统以手机屏幕图像为输入,精准操作APP界面元素。

通过RFT技术增强规划推理能力,提升任务执行成功率。

9

Flow-GRPO提升图像生成模型性能,表现优异

Flow-GRPO通过ODE到SDE转换和降噪减少策略,显著提升图像生成模型的性能。

在组合图像生成等任务上,该模型的准确率得到了显著提高。

未来有望拓展至视频生成领域,面临新的挑战。

10

谷歌测试新AI Mode按钮,或取代经典功能

谷歌正在测试新的“AI Mode”按钮,计划取代“手气不错”按钮。

该功能旨在提供更智能的搜索体验,提升搜索的智能化和个性化。

目前该功能仍处于实验阶段,仅对部分用户开放。

11

阶跃星辰发布3D大模型Step1X-3D,参数量达4.8B

Step1X-3D模型能够生成高保真、可控的3D内容,为创作提供强大技术支持。

该模型通过数据驱动与算法协同优化,解决数据稀缺与质量问题。

采用两阶段架构,确保生成的几何结构可靠、真实。