算子简报
2025-03-27 · 算子简报
阿里通义千问发布新一代多模态模型Qwen2.5-Omni
•阿里云通义千问团队推出了Qwen2.5-Omni,这是一个新一代的多模态旗舰模型,旨在实现文本、图像、音频和视频的无缝处理。
•该模型采用了创新的Thinker-Talker架构,能够进行实时音视频交互,并在多模态任务中表现出色。
•Qwen2.5-Omni在多模态任务OmniBench中表现优异,超越了同类模型。
OpenAI宣布支持Anthropic的MCP标准
•OpenAI将支持竞争对手Anthropic推出的模型上下文协议(MCP),旨在提升AI助手在特定查询中的响应准确性和相关性。
•MCP的整合将应用于多个OpenAI产品,包括ChatGPT的桌面应用程序。
•该协议允许AI模型从多种数据源获取信息,促进开发者与AI应用之间的双向连接。
Ideogram发布3.0版本,图像生成技术再创新高
•Ideogram3.0的发布标志着图像生成技术的一次重要进步,特别是在真实感、创意表现力和风格一致性方面。
•新模型支持多种复杂排版设计,增强了用户的创作体验。
•该版本在文本渲染能力上取得了质的飞跃,提升了用户的创作自由度。
可灵AI进行重大更新,提升用户创作体验
•可灵AI(Kling)近期进行了一次重要的功能升级,显著提升了用户界面和创作能力。
•更新后的界面更加简洁直观,帮助创作者更专注于内容创作。
•多图参考功能的升级使得生成速度更快,语义理解更准确。
OpenAI即将完成400亿美元融资,估值将翻倍
•根据彭博社的最新报道,OpenAI即将完成由软银牵头的一项高达400亿美元的融资。
•融资完成后,OpenAI的估值将达到3000亿美元,几乎是其2023年10月时估值的两倍。
•后续计划启动300亿美元融资,其中软银将继续加大投入,进一步支持OpenAI的发展。
淘宝启动全平台AI假图治理行动
•淘宝近期宣布在全平台范围内启动AI假图治理行动,以打击利用AI技术生成的欺骗性图片。
•该行动旨在保护消费者和原创品牌商家的合法权益,提升购物体验。
•明确规定商品图片应以实拍图为核心,禁止显著失真的合成图。
AI搜索引擎Perplexity年收入突破1亿美元
•Perplexity是一家人工智能搜索引擎初创公司,最近宣布年收入突破1亿美元。
•CEO阿拉文・斯里尼瓦斯在LinkedIn上分享了这一喜讯,显示出公司在过去一年实现了6.3倍的增长。
•尽管产品尚未完全货币化,但公司正在积极拓展市场。
美图WHEE接入DeepSeek R1,提示词优化功能上线
•美图公司旗下的AI素材生成器WHEE与DeepSeek R1的成功接入,标志着AI创作领域的一次重要进步。
•此次合作旨在通过DeepSeek的提示词设计能力,帮助用户在没有专业背景的情况下,轻松生成高质量的图像内容。
•提示词优化功能可自动补全关键词,生成丰富的文案内容。
OpenAI计划建设数据中心,或成全球最大存储客户之一
•OpenAI正在考虑建立其首个数据中心,这一计划可能使其成为全球最大的存储客户之一。
•预计OpenAI将投资数十亿美元采购硬件和软件,以满足高达5EB的存储需求。
•这一举措不仅能减少对云服务商的依赖,还可能降低运营成本。
AccVideo技术突破,实现视频生成速度提升8.5倍
•AccVideo是一项突破性的技术,显著提升了视频扩散模型的生成速度,使其提升了8.5倍。
•通过创新的蒸馏方法和合成数据集,AccVideo不仅提高了生成效率,还保持了高质量的视频输出。
•该技术在保持与预训练模型相当的性能的同时,能够生成高达720x1280分辨率、24fps的高质量视频。