算子简报

2025-04-10 · 算子简报

百度宣布文心大模型4.5 Turbo发布日期

•百度将在4月25日的Create大会上发布文心大模型4.5 Turbo。

•该模型的具体细节尚未披露，但业界对此充满期待。

•文心大模型4.5及文心大模型X1已于上月发布并向用户免费开放。

谷歌推出开源A2A协议，促进智能体间对话

•谷歌发布了Agent2Agent（A2A）协议，旨在促进不同AI智能体之间的协作。

•该协议通过标准化的通信方法解决了信息孤岛的问题。

•A2A协议的设计原则包括支持长期任务和默认安全，确保其在复杂应用中的适用性。

微信视频号加强AI工具使用规范

•微信视频创作安全中心发布公告，针对不当使用AI工具的直播行为进行专项治理。

•这些行为可能误导观众并侵犯他人肖像权，违反相关运营规范。

•平台将根据违规程度采取相应处罚措施，以确保直播环境的健康与安全。

字节跳动开源Multi-SWE-bench，提升大模型代码智能升级

•字节跳动推出Multi-SWE-bench，这是首个多语言代码修复基准数据集。

•该数据集覆盖了Python、Java、TypeScript等六种语言，构建了1632个真实任务。

•Multi-SWE-bench引入了难度分级机制，旨在提升大模型在自动修Bug能力方面的评估。

京东推出自研十亿级时序大模型TimeHF

•京东零售技术团队推出了自研的十亿级销量预测时序大模型TimeHF。

•该模型通过人类反馈的强化学习技术实现了销量预测的显著提升，准确度提高了10%以上。

•TimeHF在京东的自动化补货场景中表现卓越，成为时序预测的新标杆。

谷歌发布Firebase Studio，AI驱动的一站式开发平台

•谷歌推出Firebase Studio，旨在通过AI技术简化开发流程。

•该平台提供一站式开发体验，支持从创意到部署的全流程解决方案。

•Firebase Studio在移动开发领域表现突出，内置手机模拟器提升开发效率。

详情链接

OmniSVG模型发布，支持复杂角色生成

•OmniSVG的发布标志着SVG生成技术的重大突破，结合了视觉-语言模型和SVG标记化器。

•该模型支持从文本和图像生成SVG，具备生成复杂动漫角色的能力。

•OmniSVG展现出极高的灵活性和生成质量，适用于专业设计工作流程。

谷歌发布ADK，简化智能体开发

•谷歌推出的Agent Development Kit（ADK）旨在简化多智能体系统的构建与管理。

•ADK支持灵活的开发和部署，具备多模态交互功能。

•其模块化设计与谷歌云服务深度整合，提升了企业级应用的效率。

Veo 2通过Gemini API开放，推动AI视频生成技术

•谷歌的Veo 2视频生成模型通过Gemini API向开发者开放。

•该模型支持文本到视频和图像到视频的生成，标志着AI视频生成技术的新阶段。

•Veo 2以高保真视频生成和精准响应复杂指令而闻名。

Anthropic推出Claude Max高端订阅服务

•Anthropic推出Claude Max订阅计划，满足高端用户对AI服务的需求。

•该计划提供每月100美元和200美元的定价选项，使用限制显著提高。

•Claude Max吸引了更多用户，特别是在教育领域的AI需求方面。

OminiControl Art发布，提升AI艺术创作效率

•OminiControl Art技术的发布标志着AI艺术创作领域的一次重大突破。

•该技术结合了GPT-4o的艺术风格与FLUX.1模型，为用户提供高效的艺术图像生成工具。

•OminiControl框架通过增加少量参数，实现对扩散变换器模型的灵活控制。

谷歌Gemini加入MCP阵营，加速AI代理互联互通

•谷歌宣布Gemini模型将支持MCP协议，促进AI代理的互联互通。

•MCP作为开放标准，允许AI模型从多种数据源提取信息。

•该协议的支持将加速开发者与AI应用之间的双向连接。

Gradio 5.24版本更新，AI图像编辑功能大幅提升

•Gradio 5.24版本引入全新的ImageEditor组件，使图像编辑功能达到专业级别。

•新增的缩放、平移、透明度控制和自定义图层功能提升了开发者的灵活性。

•此次更新被视为对开发者需求的精准回应，助力他们展示AI技术成果。

WordPress.com推出AI网站构建工具，简化网页创建

•WordPress.com推出AI驱动的网站构建器，用户可在几分钟内生成美观网页。

•该工具通过聊天机器人帮助用户快速创建功能齐全的网站。

•注册后可免费试用，但实际使用需购买托管计划。

详情链接