算子简报

2025-04-10 · 算子简报

1

百度宣布文心大模型4.5 Turbo发布日期

百度将在4月25日的Create大会上发布文心大模型4.5 Turbo。

该模型的具体细节尚未披露,但业界对此充满期待。

文心大模型4.5及文心大模型X1已于上月发布并向用户免费开放。

2

谷歌推出开源A2A协议,促进智能体间对话

谷歌发布了Agent2Agent(A2A)协议,旨在促进不同AI智能体之间的协作。

该协议通过标准化的通信方法解决了信息孤岛的问题。

A2A协议的设计原则包括支持长期任务和默认安全,确保其在复杂应用中的适用性。

3

微信视频号加强AI工具使用规范

微信视频创作安全中心发布公告,针对不当使用AI工具的直播行为进行专项治理。

这些行为可能误导观众并侵犯他人肖像权,违反相关运营规范。

平台将根据违规程度采取相应处罚措施,以确保直播环境的健康与安全。

4

字节跳动开源Multi-SWE-bench,提升大模型代码智能升级

字节跳动推出Multi-SWE-bench,这是首个多语言代码修复基准数据集。

该数据集覆盖了Python、Java、TypeScript等六种语言,构建了1632个真实任务。

Multi-SWE-bench引入了难度分级机制,旨在提升大模型在自动修Bug能力方面的评估。

5

京东推出自研十亿级时序大模型TimeHF

京东零售技术团队推出了自研的十亿级销量预测时序大模型TimeHF。

该模型通过人类反馈的强化学习技术实现了销量预测的显著提升,准确度提高了10%以上。

TimeHF在京东的自动化补货场景中表现卓越,成为时序预测的新标杆。

6

谷歌发布Firebase Studio,AI驱动的一站式开发平台

谷歌推出Firebase Studio,旨在通过AI技术简化开发流程。

该平台提供一站式开发体验,支持从创意到部署的全流程解决方案。

Firebase Studio在移动开发领域表现突出,内置手机模拟器提升开发效率。

详情链接
7

OmniSVG模型发布,支持复杂角色生成

OmniSVG的发布标志着SVG生成技术的重大突破,结合了视觉-语言模型和SVG标记化器。

该模型支持从文本和图像生成SVG,具备生成复杂动漫角色的能力。

OmniSVG展现出极高的灵活性和生成质量,适用于专业设计工作流程。

8

谷歌发布ADK,简化智能体开发

谷歌推出的Agent Development Kit(ADK)旨在简化多智能体系统的构建与管理。

ADK支持灵活的开发和部署,具备多模态交互功能。

其模块化设计与谷歌云服务深度整合,提升了企业级应用的效率。

9

Veo 2通过Gemini API开放,推动AI视频生成技术

谷歌的Veo 2视频生成模型通过Gemini API向开发者开放。

该模型支持文本到视频和图像到视频的生成,标志着AI视频生成技术的新阶段。

Veo 2以高保真视频生成和精准响应复杂指令而闻名。

10

Anthropic推出Claude Max高端订阅服务

Anthropic推出Claude Max订阅计划,满足高端用户对AI服务的需求。

该计划提供每月100美元和200美元的定价选项,使用限制显著提高。

Claude Max吸引了更多用户,特别是在教育领域的AI需求方面。

11

OminiControl Art发布,提升AI艺术创作效率

OminiControl Art技术的发布标志着AI艺术创作领域的一次重大突破。

该技术结合了GPT-4o的艺术风格与FLUX.1模型,为用户提供高效的艺术图像生成工具。

OminiControl框架通过增加少量参数,实现对扩散变换器模型的灵活控制。

12

谷歌Gemini加入MCP阵营,加速AI代理互联互通

谷歌宣布Gemini模型将支持MCP协议,促进AI代理的互联互通。

MCP作为开放标准,允许AI模型从多种数据源提取信息。

该协议的支持将加速开发者与AI应用之间的双向连接。

13

Gradio 5.24版本更新,AI图像编辑功能大幅提升

Gradio 5.24版本引入全新的ImageEditor组件,使图像编辑功能达到专业级别。

新增的缩放、平移、透明度控制和自定义图层功能提升了开发者的灵活性。

此次更新被视为对开发者需求的精准回应,助力他们展示AI技术成果。

14

WordPress.com推出AI网站构建工具,简化网页创建

WordPress.com推出AI驱动的网站构建器,用户可在几分钟内生成美观网页。

该工具通过聊天机器人帮助用户快速创建功能齐全的网站。

注册后可免费试用,但实际使用需购买托管计划。

详情链接