算子简报

2025-05-09 · 算子简报

1

扣子空间正式开放测试,无需邀请码即可使用

扣子空间(Coze Space)现已开放测试,用户无需邀请码即可登录使用。

该平台展示了强大的AI协作能力,吸引了内测用户创建多种优质案例。

扣子空间提供通用AI助手及多种行业专家Agent,满足不同需求。

2

腾讯推出HunyuanCustom,音频与视频编辑同步

腾讯的HunyuanCustom是一款一致性视频生成工具,支持音频与口型的精准同步。

该工具允许用户通过单张图像生成生动的视频内容,提升创作效率。

HunyuanCustom具备强大的视频编辑功能,为创作者提供更多创意空间。

3

阿里巴巴ZeroSearch技术降低AI训练成本88%

阿里巴巴推出的ZeroSearch技术通过模拟方法改变AI训练模式,降低了对昂贵API的依赖。

该技术显著降低了AI训练的经济负担,提升了搜索引擎返回文档的质量。

ZeroSearch在多个模型上验证成功,预示AI系统将更自给自足。

4

OpenAI推出GitHub连接器,增强ChatGPT功能

OpenAI宣布对其深度研究工具进行升级,新增GitHub连接器。

该功能帮助开发者更有效地分析代码库和工程文档,方便编程工作。

用户可以直接询问代码相关问题,提升开发效率。

5

联想发布天禧个人超级智能体,布局各类终端设备

联想在创新科技大会上推出天禧个人超级智能体,标志着混合式人工智能的重大突破。

天禧具备感知与交互、认知与决策、自主与演进三大核心功能。

该智能体能够实时感知环境并与用户互动,提供个性化建议。

6

OpenAI在亚洲推出数据驻留计划,助力企业合规

OpenAI推出数据驻留计划,帮助当地企业满足数据主权要求。

该计划适用于多个产品,允许用户选择数据存储地点。

数据存储地点包括日本、印度、新加坡和韩国,确保用户数据安全。

7

Multiverse发布全球首款AI生成多人在线游戏

EnigmaLabsAI团队推出的Multiverse被誉为全球首款由AI生成的多人在线游戏。

该游戏以AI驱动的动态世界和极低的研发成本震撼行业。

Multiverse的完全开源开发理念激发了社区活力,推动了技术的快速迭代。

8

秘塔AI搜索上线“讲题”功能,降低家长辅导门槛

秘塔公司推出“塔子老师讲题”功能,旨在缓解家长辅导孩子作业的压力。

该功能通过AI技术实现题目自动识别和解题步骤的可视化讲解。

覆盖从小学到成人考证的各个学段,支持拍照上传后自动解析。

9

Genspark推出“AI Sheets”电子表格AI工具,革新数据处理体验

Genspark推出的“AI Sheets”工具通过智能化手段简化数据处理流程。

该工具支持聊天操作,自动完成数据搜索、整理、分析与可视化。

AI Sheets颠覆传统电子表格使用方式,提升用户办公效率。

10

Google Gemini API迎来隐式缓存功能,节省开发成本

Google在Gemini API中推出隐式缓存功能,帮助开发者显著降低成本。

该功能自动识别和重用相似请求的内容,简化了开发者的操作流程。

隐式缓存无需手动定义高频请求,提升了开发效率。

11

PixVerse v4登陆Replicate,AI视频生成再突破

PixVerse v4在Replicate平台上线,为内容创作者带来高清视频生成体验。

新版本支持多种分辨率的视频生成,显著提升生成速度和视觉效果。

引入音效同步和风格迁移功能,用户可轻松生成带有自然音效的视频。

12

快手推出“内容净化器”KuaiMod,提升短视频内容质量

快手推出KuaiMod,旨在优化短视频平台生态,提升内容质量。

KuaiMod通过建立1000条视频的数据集,提升内容识别的准确性。

该工具采用强化学习策略,实时更新模型以应对用户偏好的变化。

13

英伟达开源新一代OCR模型,超越OpenAI表现

英伟达推出的Open Code Reasoning(OCR)模型套装引起广泛关注。

该模型套装包含多种参数规模的模型,适应多语言和多任务学习。

在LiveCodeBench基准测试中,OCR模型的表现超越OpenAI的o3-Mini和o1模型。