算子简报

2025-03-27 · 算子简报

1

阿里通义千问发布新一代多模态模型Qwen2.5-Omni

阿里云通义千问团队推出了Qwen2.5-Omni,这是一个新一代的多模态旗舰模型,旨在实现文本、图像、音频和视频的无缝处理。

该模型采用了创新的Thinker-Talker架构,能够进行实时音视频交互,并在多模态任务中表现出色。

Qwen2.5-Omni在多模态任务OmniBench中表现优异,超越了同类模型。

2

OpenAI宣布支持Anthropic的MCP标准

OpenAI将支持竞争对手Anthropic推出的模型上下文协议(MCP),旨在提升AI助手在特定查询中的响应准确性和相关性。

MCP的整合将应用于多个OpenAI产品,包括ChatGPT的桌面应用程序。

该协议允许AI模型从多种数据源获取信息,促进开发者与AI应用之间的双向连接。

3

Ideogram发布3.0版本,图像生成技术再创新高

Ideogram3.0的发布标志着图像生成技术的一次重要进步,特别是在真实感、创意表现力和风格一致性方面。

新模型支持多种复杂排版设计,增强了用户的创作体验。

该版本在文本渲染能力上取得了质的飞跃,提升了用户的创作自由度。

4

可灵AI进行重大更新,提升用户创作体验

可灵AI(Kling)近期进行了一次重要的功能升级,显著提升了用户界面和创作能力。

更新后的界面更加简洁直观,帮助创作者更专注于内容创作。

多图参考功能的升级使得生成速度更快,语义理解更准确。

5

OpenAI即将完成400亿美元融资,估值将翻倍

根据彭博社的最新报道,OpenAI即将完成由软银牵头的一项高达400亿美元的融资。

融资完成后,OpenAI的估值将达到3000亿美元,几乎是其2023年10月时估值的两倍。

后续计划启动300亿美元融资,其中软银将继续加大投入,进一步支持OpenAI的发展。

6

淘宝启动全平台AI假图治理行动

淘宝近期宣布在全平台范围内启动AI假图治理行动,以打击利用AI技术生成的欺骗性图片。

该行动旨在保护消费者和原创品牌商家的合法权益,提升购物体验。

明确规定商品图片应以实拍图为核心,禁止显著失真的合成图。

7

AI搜索引擎Perplexity年收入突破1亿美元

Perplexity是一家人工智能搜索引擎初创公司,最近宣布年收入突破1亿美元。

CEO阿拉文・斯里尼瓦斯在LinkedIn上分享了这一喜讯,显示出公司在过去一年实现了6.3倍的增长。

尽管产品尚未完全货币化,但公司正在积极拓展市场。

8

美图WHEE接入DeepSeek R1,提示词优化功能上线

美图公司旗下的AI素材生成器WHEE与DeepSeek R1的成功接入,标志着AI创作领域的一次重要进步。

此次合作旨在通过DeepSeek的提示词设计能力,帮助用户在没有专业背景的情况下,轻松生成高质量的图像内容。

提示词优化功能可自动补全关键词,生成丰富的文案内容。

9

OpenAI计划建设数据中心,或成全球最大存储客户之一

OpenAI正在考虑建立其首个数据中心,这一计划可能使其成为全球最大的存储客户之一。

预计OpenAI将投资数十亿美元采购硬件和软件,以满足高达5EB的存储需求。

这一举措不仅能减少对云服务商的依赖,还可能降低运营成本。

10

AccVideo技术突破,实现视频生成速度提升8.5倍

AccVideo是一项突破性的技术,显著提升了视频扩散模型的生成速度,使其提升了8.5倍。

通过创新的蒸馏方法和合成数据集,AccVideo不仅提高了生成效率,还保持了高质量的视频输出。

该技术在保持与预训练模型相当的性能的同时,能够生成高达720x1280分辨率、24fps的高质量视频。