算子简报

2025-04-23 · 算子简报

1

Kortix-AI发布开源AI智能体平台Suna,成为Manus的替代品

Kortix-AI推出了Suna,一个开源的通用AI智能体平台,旨在成为Manus的替代品。

Suna集成了浏览器自动化、文件管理和API集成等多种功能,支持复杂任务的自动化处理。

该平台的开源特性和灵活部署选项使其成为开发者和企业的理想选择。

详情链接
2

腾讯混元3D生成模型发布2.5版本,提升3D内容创作体验

腾讯混元3D生成模型的2.5版本正式发布,标志着3D生成技术进入超高清时代。

新版本支持4K高清纹理和细粒度bump贴图,增强了模型的真实感和质感。

免费生成额度翻倍,提升至每天20次,吸引更多创作者尝试使用。

详情链接
3

海螺推出图像人物参考功能,提升AI图像生成创意

MiniMax旗下的Hailuo AI推出了Character Reference功能,允许用户基于单张参考图像生成多角度角色图像。

该功能引入丰富的表情控制和电影化的光影效果,提升了AI图像生成的创意表达。

用户可以生成角色在不同视角与姿势的图像,保持角色特征一致。

详情链接
4

百度推出“心响”App,提供复杂任务的全托管AI服务

百度推出的心响App是一款多智能体协作应用,旨在解决用户日常生活中的复杂需求。

该应用整合了地图类MCP功能,支持行程自动标注和出行打车推荐。

用户只需自然语言描述需求,系统便能快速规划出行方案。

5

开源TTS模型Dia发布,支持情绪和非语言提示

Nari Labs发布了开源文本转语音模型Dia,具备16亿参数,旨在生成自然对话。

Dia在情感语调和非语言提示方面表现出色,能够正确解读多种文本标签。

该模型的代码和权重已在Hugging Face和GitHub上开源,供用户下载和体验。

详情链接
6

Grok进行大更新,新增视觉能力和多语言音频处理

Grok的最新更新为用户带来了视觉处理、多语言音频交互和实时搜索功能的显著提升。

用户可以上传图片进行分析,支持145种语言的实时语音交互,方便跨语言沟通。

新增的实时搜索功能使用户能够通过语音指令快速获取最新信息。

7

Genspark推出AI幻灯片工具,提升演示文稿创作效率

Genspark推出的AI幻灯片工具通过自动化和智能整合,显著提升了专业演示文稿的创作效率。

该工具支持多种数据格式的处理,能够快速生成学术报告和商业演示。

尤其适合学术研究和企业报告,满足多样化需求。

8

Character.AI推出AvatarFX模型,静态图片变身动态角色

Character.AI推出的AvatarFX模型能够将静态图片转化为生动的可说话视频角色。

该技术实现了图像中的人物动态表情和唇部同步,增强了用户的沉浸感。

用户可自由选择不同风格的声音,提升故事叙述的生动性。

详情链接
9

pad.ws推出白板+代码编辑器组合工具,支持边画边编程

pad.ws是一款创新的在线工具,将白板与代码编辑器结合,提供全新的协作体验。

支持多种编程语言,具备实时协作和无限画布等功能,满足远程团队需求。

用户可以在无限画布上绘制流程图和草图,提升团队效率。

详情链接
10

OpenBMB推出“卷姬”,革新长文本生成

OpenBMB新成员“卷姬”在长文本生成领域引起广泛关注,能够高效整合大量文献。

用户只需提供关键词,便可获得逻辑严谨、见解独到的内容。

与其他模型的横向评测显示,“卷姬”在结构、内容及引用方面表现优异。

11

腾讯推出AI阅读助手“企鹅读伴”,提升学生阅读体验

腾讯在世界读书日推出的“企鹅读伴”是一款创新的AI阅读助手,旨在为中小学生提供丰富的阅读体验。

该产品结合了AI技术与教育理念,能够根据学生的年级和兴趣进行个性化书籍推荐。

通过角色扮演和情景生成,增强学生对经典作品的理解。

12

OpenAI有意收购谷歌Chrome,司法部或迫使出售

OpenAI表示有意收购谷歌的Chrome浏览器,若其被迫出售。

美国司法部在“美国诉谷歌”案中提出强制剥离Chrome的救济措施。

OpenAI高管透露曾与谷歌洽谈合作,希望ChatGPT使用谷歌搜索技术。

13

字节跳动调整AI产品线,聚焦核心增长

字节跳动近期对AI产品部门Flow进行了重要调整,旨在应对增长压力。

猫箱更换负责人,星绘团队并入豆包App,资源集中于核心产品豆包。

该调整旨在实现更快增长,以应对日益激烈的市场竞争。