算子简报

2025-04-03 · 算子简报

1

即梦3.0内测:设计师的救星,能生成2K商业海报

即梦3.0模型在图像生成领域取得了重大突破,能够通过简单的文字提示生成高质量、细节丰富的图像。

该模型对复杂场景和细节的精准把控,使得生成的视觉效果超越了传统设计师的手工绘制水平。

从输入提示到输出成品仅需数秒,极大提升了创意迭代的效率。

2

ChatGPT更新:图片生成功能再升级

ChatGPT的图片生成能力得到了显著提升,尤其是在中文文字生成方面。

新版本支持草书生成,并在细节渲染和对复杂指令的理解上有了明显改进。

用户能够通过简单的描述生成高质量的图像,展示了OpenAI在算法优化上的深厚积累。

3

饿了么推出AI入驻智能经理,商家上线仅需5分钟

饿了么推出了“AI入驻智能经理”这一智能助手,旨在简化新商家的入驻流程。

商家在启动外卖业务时,整个入驻过程可在最快5分钟内完成,极大地提高了效率。

该助手提供24小时自然语言对话服务,支持商家完成实名认证、签约授权、材料上传等一站式操作。

4

Hugging Face推出新功能:一键查看可运行模型

Hugging Face推出了一个新功能,允许用户轻松查看其电脑硬件可以运行哪些机器学习模型。

用户只需在个人设置中添加硬件信息,系统将智能分析并显示可运行的模型。

这一功能简化了模型选择过程,特别对开发者和AI爱好者非常友好。

5

字节跳动发布MegaTTS3:轻量化语音合成新突破

字节跳动在Hugging Face上发布了其最新的文本转语音模型MegaTTS3,吸引了全球AI研究者的关注。

该模型以其轻量化设计和多语言支持而闻名,参数仅为0.45亿,适合资源受限的设备使用。

支持中英混合朗读和口音强度控制,用户可生成多样化的语音输出,满足个性化需求。

详情链接
6

OpenAI的o3模型成本修正:每任务价格或将达到30,000美元

Arc Prize Foundation对OpenAI即将推出的o3推理AI模型的成本估算进行了重大修正,预计每项ARC-AGI任务的费用将达到30,000美元。

这一价格比最初的3,000美元高出十倍,显示出高昂的运行费用。

o3模型的复杂性使得其计算需求显著增加,反映出其在解决ARC-AGI问题时的挑战。

7

Genspark发布Super Agent:具备自主思考和工具调用能力

Genspark推出了全新的自动化AI代理Super Agent,凭借其强大的自主思考和任务执行能力,迅速成为行业的焦点。

该系统采用创新的多智能体混合系统设计,能够在多种场景下高效处理任务。

Super Agent配备超过80种工具,能够与外部系统无缝交互,完成从信息检索到实际操作的全流程任务。

详情链接
8

OpenAI推出AI Agent评测基准PaperBench

OpenAI团队推出了PaperBench基准测试,旨在评估AI代理在复制先进AI研究方面的能力。

该测试要求AI代理从头开始复制20篇2024年国际机器学习会议的重点和口头论文。

研究团队设计了详细的评分标准,并开发了基于大型语言模型的自动评分系统。

详情链接
9

2024年全球移动发行商收入榜单发布,OpenAI首次上榜

Sensor Tower发布的《2024年全球移动发行商收入 TOP50》榜单显示,全球移动应用市场付费总额首次突破1500亿美元,增长13%。

腾讯继续稳居第一,字节跳动紧随其后,AI技术的崛起使OpenAI首次进入榜单。

OpenAI在用户分析和个性化推荐方面的进步,反映了其在行业中的快速发展。

10

谷歌DeepMind预测:2030年AGI可能超越人类

谷歌DeepMind最近发布了一份战略文件,详细阐述了其开发安全人工通用智能(AGI)的方针。

AGI被定义为能够与人类在大多数认知任务中匹配或超越的系统,预计将是实现AGI的主要途径。

DeepMind关注防止AI滥用和目标错位,推出多层次安全策略以确保AGI的安全性。

11

NotebookLM推出“Discover sources”功能,助力信息获取

谷歌的NotebookLM推出了新功能“Discover sources”,旨在帮助用户快速获取网络上的相关信息。

用户只需输入感兴趣的主题,系统便能迅速找到相关网页并总结。

这一功能使得用户可以一键将这些来源添加到笔记本中,方便查阅。