算子简报

2025-02-24 · 算子简报

DeepSeek发布FlashMLA，解码性能提升至3000GB/s

•DeepSeek在开源周首日推出了FlashMLA，专为英伟达Hopper架构GPU设计。

•该技术通过BF16精度和创新的页式键值缓存系统，显著提升了内存管理的精确性。

•在H800SXM5 GPU上，FlashMLA在内存受限场景下达到3000GB/s的处理速度。

详情链接

海螺AI推出I2V-01-Director模型，开放给所有用户

•海螺AI最新推出的I2V-01-Director模型为全球用户提供了AI视频生成工具。

•该工具允许用户通过自然语言指令控制镜头运动，轻松将创意转化为电影作品。

•海螺AI已将该模型整合至视频创作平台，用户可立即体验。

详情链接

谷歌Veo 2视频生成模型使用成本曝光

•谷歌公布了视频生成AI模型Veo 2的定价信息，费用为每秒50美分。

•一分钟视频的制作成本为30美元，每小时则高达1800美元。

•与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比，Veo 2的定价显得相对划算。

Grok 3上线实时语音功能，支持多种交互模式

•Grok APP推出实时语音模式，支持多达10种交互模式，提升用户体验。

•新增的Unhinged和Sexy模式引起广泛关注，前者以挑衅式争论为特点。

•这一更新引发了对内容审核和未成年用户影响的讨论。

百度APP全面焕新，推出AI入口DeepseekR1

•百度App宣布全量上线全新的AI入口，深度整合文心大模型与DeepSeek模型。

•新功能包括AI搜索、全网信息提炼、AI总结和数字人智能体，能够精准理解用户需求。

•升级首日使用量突破千万次，显示出用户对新功能的高度认可。

腾讯混元视频模型（Hunyuan Video）测试招募中

•腾讯混元视频模型近期在X平台上公开招募测试伙伴，标志着其AI视频生成技术进入关键测试阶段。

•该模型以超过13B参数量成为开源视频生成模型中的佼佼者，展现出卓越的性能。

•招募测试伙伴旨在通过合作提升模型性能，参与者将为模型开源前的稳定性和实用性提供反馈。

详情链接

月之暗面与UCLA联合推出Mixture-of-Expert模型

•Moonshot AI与UCLA联合开发的Moonlight模型，采用Muon优化器，显著提升了大型语言模型的训练效率。

•该模型在多个任务上超越了传统的AdamW优化器，尤其在语言理解和代码生成方面表现优异。

•Moonlight模型提供30亿和160亿参数配置，训练使用了5.7万亿个标记。

详情链接

1x发布家庭机器人NEO Gamma，具备多项家务功能

•1X公司最新推出的家居机器人Neo Gamma具备多项家务功能，如冲咖啡、洗衣和吸尘。

•该机器人设计更为温和亲切，易于引发情感依赖。

•Neo Gamma具备自然运动能力和语言交互功能，未来将与家庭生活紧密结合。

详情链接

小米即将推出首款AI PC产品

•小米集团合伙人兼总裁卢伟冰宣布，小米即将推出其首款AI PC产品。

•这款新产品搭载的99Wh超大电池符合民航运输的安全标准。

•该产品旨在提升用户在移动办公时的续航能力，解决续航焦虑。

阿里巴巴宣布3800亿投资云与AI硬件建设

•阿里巴巴集团CEO吴泳铭宣布未来三年将投入超过3800亿元人民币用于云和AI硬件基础设施建设。

•这一创纪录的投资展示了阿里在AI时代的技术野心与战略布局。

•投资将加速国内AI产业的智能化转型，提升中国在全球AI竞赛中的竞争力。

Meta AI发布新型视频学习模型V-JEPA，视频理解新突破

•Meta AI团队推出的V-JEPA模型在无监督视频学习领域取得重大突破。

•该模型通过特征预测原则，利用视频数据直接进行学习，避免了传统方法的依赖。

•V-JEPA在捕捉细微运动细节方面具有优势，展现了其在视频理解中的潜力。

详情链接

LiblibAI获得数亿元融资，创下融资速度新纪录

•LiblibAI在一年内成功完成四轮融资，创下国内AI应用赛道融资速度的新纪录。

•此次融资再获数亿元资金，进一步巩固了其在行业内的领先地位。

•公司致力于通过AI技术改变创作者的创作方式，建立完整的创作生态链。

Pixverse V4.0更新，新增音效与转绘功能

•Pixverse发布了V4.0版本，增强了底层模型，新增同步生成音效和转绘功能。

•用户可以通过“Restyle”功能将视频风格转换，生成速度和真实感显著提升。

•此次更新为内容创作者提供了更丰富的创作体验，并受到广泛好评。