算子简报
2025-04-10 · 算子简报
百度宣布文心大模型4.5 Turbo发布日期
•百度将在4月25日的Create大会上发布文心大模型4.5 Turbo。
•该模型的具体细节尚未披露,但业界对此充满期待。
•文心大模型4.5及文心大模型X1已于上月发布并向用户免费开放。
谷歌推出开源A2A协议,促进智能体间对话
•谷歌发布了Agent2Agent(A2A)协议,旨在促进不同AI智能体之间的协作。
•该协议通过标准化的通信方法解决了信息孤岛的问题。
•A2A协议的设计原则包括支持长期任务和默认安全,确保其在复杂应用中的适用性。
微信视频号加强AI工具使用规范
•微信视频创作安全中心发布公告,针对不当使用AI工具的直播行为进行专项治理。
•这些行为可能误导观众并侵犯他人肖像权,违反相关运营规范。
•平台将根据违规程度采取相应处罚措施,以确保直播环境的健康与安全。
字节跳动开源Multi-SWE-bench,提升大模型代码智能升级
•字节跳动推出Multi-SWE-bench,这是首个多语言代码修复基准数据集。
•该数据集覆盖了Python、Java、TypeScript等六种语言,构建了1632个真实任务。
•Multi-SWE-bench引入了难度分级机制,旨在提升大模型在自动修Bug能力方面的评估。
京东推出自研十亿级时序大模型TimeHF
•京东零售技术团队推出了自研的十亿级销量预测时序大模型TimeHF。
•该模型通过人类反馈的强化学习技术实现了销量预测的显著提升,准确度提高了10%以上。
•TimeHF在京东的自动化补货场景中表现卓越,成为时序预测的新标杆。
谷歌发布Firebase Studio,AI驱动的一站式开发平台
•谷歌推出Firebase Studio,旨在通过AI技术简化开发流程。
•该平台提供一站式开发体验,支持从创意到部署的全流程解决方案。
•Firebase Studio在移动开发领域表现突出,内置手机模拟器提升开发效率。
OmniSVG模型发布,支持复杂角色生成
•OmniSVG的发布标志着SVG生成技术的重大突破,结合了视觉-语言模型和SVG标记化器。
•该模型支持从文本和图像生成SVG,具备生成复杂动漫角色的能力。
•OmniSVG展现出极高的灵活性和生成质量,适用于专业设计工作流程。
谷歌发布ADK,简化智能体开发
•谷歌推出的Agent Development Kit(ADK)旨在简化多智能体系统的构建与管理。
•ADK支持灵活的开发和部署,具备多模态交互功能。
•其模块化设计与谷歌云服务深度整合,提升了企业级应用的效率。
Veo 2通过Gemini API开放,推动AI视频生成技术
•谷歌的Veo 2视频生成模型通过Gemini API向开发者开放。
•该模型支持文本到视频和图像到视频的生成,标志着AI视频生成技术的新阶段。
•Veo 2以高保真视频生成和精准响应复杂指令而闻名。
Anthropic推出Claude Max高端订阅服务
•Anthropic推出Claude Max订阅计划,满足高端用户对AI服务的需求。
•该计划提供每月100美元和200美元的定价选项,使用限制显著提高。
•Claude Max吸引了更多用户,特别是在教育领域的AI需求方面。
OminiControl Art发布,提升AI艺术创作效率
•OminiControl Art技术的发布标志着AI艺术创作领域的一次重大突破。
•该技术结合了GPT-4o的艺术风格与FLUX.1模型,为用户提供高效的艺术图像生成工具。
•OminiControl框架通过增加少量参数,实现对扩散变换器模型的灵活控制。
谷歌Gemini加入MCP阵营,加速AI代理互联互通
•谷歌宣布Gemini模型将支持MCP协议,促进AI代理的互联互通。
•MCP作为开放标准,允许AI模型从多种数据源提取信息。
•该协议的支持将加速开发者与AI应用之间的双向连接。
Gradio 5.24版本更新,AI图像编辑功能大幅提升
•Gradio 5.24版本引入全新的ImageEditor组件,使图像编辑功能达到专业级别。
•新增的缩放、平移、透明度控制和自定义图层功能提升了开发者的灵活性。
•此次更新被视为对开发者需求的精准回应,助力他们展示AI技术成果。
WordPress.com推出AI网站构建工具,简化网页创建
•WordPress.com推出AI驱动的网站构建器,用户可在几分钟内生成美观网页。
•该工具通过聊天机器人帮助用户快速创建功能齐全的网站。
•注册后可免费试用,但实际使用需购买托管计划。