算子简报

2025-04-04 · 算子简报

1

即梦3.0内测:设计师的福音,支持生成2K商业海报

即梦3.0模型在图像生成领域实现了重大突破,能够通过简单的文字提示生成高质量的图像。

该模型在复杂场景和细节的把控上超越了传统设计师的手工绘制水平。

用户可以在数秒内获得输出,极大提升创意迭代的效率。

2

ChatGPT更新:图片生成功能再度升级

ChatGPT的图片生成能力得到了显著提升,尤其是在中文文字生成方面。

新版本支持草书生成,并在细节渲染和复杂指令理解上有了明显改进。

用户能够通过简单描述快速生成高质量图像,展示了OpenAI在算法优化上的深厚积累。

3

饿了么推出AI入驻智能经理,商家上线仅需5分钟

饿了么推出的“AI入驻智能经理”旨在简化新商家的入驻流程。

商家在启动外卖业务时,整个入驻过程可在最快5分钟内完成,极大提高了效率。

该助手提供24小时自然语言对话服务,支持商家完成实名认证、签约授权等一站式操作。

4

Hugging Face推出新功能:一键查看可运行模型

Hugging Face推出的新功能允许用户轻松查看其电脑硬件可以运行哪些机器学习模型。

用户只需在个人设置中添加硬件信息,系统将智能分析并显示可运行的模型。

这一功能简化了模型选择过程,特别对开发者和AI爱好者非常友好。

5

字节跳动发布MegaTTS3:轻量化语音合成新突破

字节跳动在Hugging Face上发布了其最新的文本转语音模型MegaTTS3,吸引了全球AI研究者的关注。

该模型以其轻量化设计和多语言支持而闻名,参数仅为0.45亿,适合资源受限的设备使用。

MegaTTS3支持中英混合朗读和口音强度控制,用户可生成多样化的语音输出。

详情链接
6

OpenAI的o3模型成本修正:每任务价格或将达到30,000美元

Arc Prize Foundation对OpenAI即将推出的o3推理AI模型的成本估算进行了重大修正。

预计每项ARC-AGI任务的费用将达到30,000美元,比最初的3,000美元高出十倍。

o3模型的复杂性和计算需求显著增加,反映出其高昂的运行费用。

7

Genspark发布Super Agent:具备自主思考与工具调用能力的AI代理

Genspark推出的Super Agent具备强大的自主思考和任务执行能力,迅速成为行业焦点。

该系统采用创新的多智能体混合系统设计,能够高效处理多种场景下的任务。

Super Agent配备超过80种工具,能够与外部系统无缝交互,完成从信息检索到实际操作的全流程任务。

详情链接
8

OpenAI推出AI Agent评测基准PaperBench

OpenAI团队推出了PaperBench基准测试,旨在评估AI代理在复制先进AI研究方面的能力。

该测试要求AI代理从头开始复制20篇2024年国际机器学习会议的重点和口头论文。

研究团队设计了详细的评分标准,并开发了基于大型语言模型的自动评分系统。

详情链接
9

2024年全球移动发行商收入榜单发布,OpenAI首次上榜

Sensor Tower发布的《2024年全球移动发行商收入 TOP50》榜单显示,全球移动应用市场付费总额首次突破1500亿美元。

腾讯继续稳居第一,字节跳动紧随其后,AI技术的崛起使OpenAI首次进入榜单。

OpenAI在用户分析和个性化推荐方面的进步显著,反映出其在市场中的竞争力。

10

谷歌DeepMind预测:到2030年AGI可能会超过人类并发布安全策略

谷歌DeepMind最近发布了一份战略文件,阐述了开发安全人工通用智能(AGI)的方针。

AGI被定义为能够与人类在大多数认知任务中匹配或超越的系统。

DeepMind预计,当前的机器学习方法将是实现AGI的主要途径,关注防止AI滥用和目标错位。

11

NotebookLM推出“Discover sources”功能,助力信息获取

谷歌的NotebookLM推出了新功能“Discover sources”,旨在帮助用户快速获取网络上的相关信息。

用户只需输入感兴趣的主题,系统便能迅速找到相关网页并总结。

这一功能让用户可以一键将这些来源添加到笔记本中,方便查阅。