算子简报

2025-02-24 · 算子简报

1

DeepSeek发布FlashMLA,解码性能提升至3000GB/s

DeepSeek在开源周首日推出了FlashMLA,专为英伟达Hopper架构GPU设计。

该技术通过BF16精度和创新的页式键值缓存系统,显著提升了内存管理的精确性。

在H800SXM5 GPU上,FlashMLA在内存受限场景下达到3000GB/s的处理速度。

详情链接
2

海螺AI推出I2V-01-Director模型,开放给所有用户

海螺AI最新推出的I2V-01-Director模型为全球用户提供了AI视频生成工具。

该工具允许用户通过自然语言指令控制镜头运动,轻松将创意转化为电影作品。

海螺AI已将该模型整合至视频创作平台,用户可立即体验。

详情链接
3

谷歌Veo 2视频生成模型使用成本曝光

谷歌公布了视频生成AI模型Veo 2的定价信息,费用为每秒50美分。

一分钟视频的制作成本为30美元,每小时则高达1800美元。

与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo 2的定价显得相对划算。

4

Grok 3上线实时语音功能,支持多种交互模式

Grok APP推出实时语音模式,支持多达10种交互模式,提升用户体验。

新增的Unhinged和Sexy模式引起广泛关注,前者以挑衅式争论为特点。

这一更新引发了对内容审核和未成年用户影响的讨论。

5

百度APP全面焕新,推出AI入口DeepseekR1

百度App宣布全量上线全新的AI入口,深度整合文心大模型与DeepSeek模型。

新功能包括AI搜索、全网信息提炼、AI总结和数字人智能体,能够精准理解用户需求。

升级首日使用量突破千万次,显示出用户对新功能的高度认可。

6

腾讯混元视频模型(Hunyuan Video)测试招募中

腾讯混元视频模型近期在X平台上公开招募测试伙伴,标志着其AI视频生成技术进入关键测试阶段。

该模型以超过13B参数量成为开源视频生成模型中的佼佼者,展现出卓越的性能。

招募测试伙伴旨在通过合作提升模型性能,参与者将为模型开源前的稳定性和实用性提供反馈。

详情链接
7

月之暗面与UCLA联合推出Mixture-of-Expert模型

Moonshot AI与UCLA联合开发的Moonlight模型,采用Muon优化器,显著提升了大型语言模型的训练效率。

该模型在多个任务上超越了传统的AdamW优化器,尤其在语言理解和代码生成方面表现优异。

Moonlight模型提供30亿和160亿参数配置,训练使用了5.7万亿个标记。

详情链接
8

1x发布家庭机器人NEO Gamma,具备多项家务功能

1X公司最新推出的家居机器人Neo Gamma具备多项家务功能,如冲咖啡、洗衣和吸尘。

该机器人设计更为温和亲切,易于引发情感依赖。

Neo Gamma具备自然运动能力和语言交互功能,未来将与家庭生活紧密结合。

详情链接
9

小米即将推出首款AI PC产品

小米集团合伙人兼总裁卢伟冰宣布,小米即将推出其首款AI PC产品。

这款新产品搭载的99Wh超大电池符合民航运输的安全标准。

该产品旨在提升用户在移动办公时的续航能力,解决续航焦虑。

10

阿里巴巴宣布3800亿投资云与AI硬件建设

阿里巴巴集团CEO吴泳铭宣布未来三年将投入超过3800亿元人民币用于云和AI硬件基础设施建设。

这一创纪录的投资展示了阿里在AI时代的技术野心与战略布局。

投资将加速国内AI产业的智能化转型,提升中国在全球AI竞赛中的竞争力。

11

Meta AI发布新型视频学习模型V-JEPA,视频理解新突破

Meta AI团队推出的V-JEPA模型在无监督视频学习领域取得重大突破。

该模型通过特征预测原则,利用视频数据直接进行学习,避免了传统方法的依赖。

V-JEPA在捕捉细微运动细节方面具有优势,展现了其在视频理解中的潜力。

详情链接
12

LiblibAI获得数亿元融资,创下融资速度新纪录

LiblibAI在一年内成功完成四轮融资,创下国内AI应用赛道融资速度的新纪录。

此次融资再获数亿元资金,进一步巩固了其在行业内的领先地位。

公司致力于通过AI技术改变创作者的创作方式,建立完整的创作生态链。

13

Pixverse V4.0更新,新增音效与转绘功能

Pixverse发布了V4.0版本,增强了底层模型,新增同步生成音效和转绘功能。

用户可以通过“Restyle”功能将视频风格转换,生成速度和真实感显著提升。

此次更新为内容创作者提供了更丰富的创作体验,并受到广泛好评。