算子简报
2025-02-24 · 算子简报
DeepSeek发布FlashMLA,解码性能提升至3000GB/s
•DeepSeek在开源周首日推出了FlashMLA,专为英伟达Hopper架构GPU设计。
•该技术通过BF16精度和创新的页式键值缓存系统,显著提升了内存管理的精确性。
•在H800SXM5 GPU上,FlashMLA在内存受限场景下达到3000GB/s的处理速度。
海螺AI推出I2V-01-Director模型,开放给所有用户
•海螺AI最新推出的I2V-01-Director模型为全球用户提供了AI视频生成工具。
•该工具允许用户通过自然语言指令控制镜头运动,轻松将创意转化为电影作品。
•海螺AI已将该模型整合至视频创作平台,用户可立即体验。
谷歌Veo 2视频生成模型使用成本曝光
•谷歌公布了视频生成AI模型Veo 2的定价信息,费用为每秒50美分。
•一分钟视频的制作成本为30美元,每小时则高达1800美元。
•与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo 2的定价显得相对划算。
Grok 3上线实时语音功能,支持多种交互模式
•Grok APP推出实时语音模式,支持多达10种交互模式,提升用户体验。
•新增的Unhinged和Sexy模式引起广泛关注,前者以挑衅式争论为特点。
•这一更新引发了对内容审核和未成年用户影响的讨论。
百度APP全面焕新,推出AI入口DeepseekR1
•百度App宣布全量上线全新的AI入口,深度整合文心大模型与DeepSeek模型。
•新功能包括AI搜索、全网信息提炼、AI总结和数字人智能体,能够精准理解用户需求。
•升级首日使用量突破千万次,显示出用户对新功能的高度认可。
腾讯混元视频模型(Hunyuan Video)测试招募中
•腾讯混元视频模型近期在X平台上公开招募测试伙伴,标志着其AI视频生成技术进入关键测试阶段。
•该模型以超过13B参数量成为开源视频生成模型中的佼佼者,展现出卓越的性能。
•招募测试伙伴旨在通过合作提升模型性能,参与者将为模型开源前的稳定性和实用性提供反馈。
月之暗面与UCLA联合推出Mixture-of-Expert模型
•Moonshot AI与UCLA联合开发的Moonlight模型,采用Muon优化器,显著提升了大型语言模型的训练效率。
•该模型在多个任务上超越了传统的AdamW优化器,尤其在语言理解和代码生成方面表现优异。
•Moonlight模型提供30亿和160亿参数配置,训练使用了5.7万亿个标记。
1x发布家庭机器人NEO Gamma,具备多项家务功能
•1X公司最新推出的家居机器人Neo Gamma具备多项家务功能,如冲咖啡、洗衣和吸尘。
•该机器人设计更为温和亲切,易于引发情感依赖。
•Neo Gamma具备自然运动能力和语言交互功能,未来将与家庭生活紧密结合。
小米即将推出首款AI PC产品
•小米集团合伙人兼总裁卢伟冰宣布,小米即将推出其首款AI PC产品。
•这款新产品搭载的99Wh超大电池符合民航运输的安全标准。
•该产品旨在提升用户在移动办公时的续航能力,解决续航焦虑。
阿里巴巴宣布3800亿投资云与AI硬件建设
•阿里巴巴集团CEO吴泳铭宣布未来三年将投入超过3800亿元人民币用于云和AI硬件基础设施建设。
•这一创纪录的投资展示了阿里在AI时代的技术野心与战略布局。
•投资将加速国内AI产业的智能化转型,提升中国在全球AI竞赛中的竞争力。
Meta AI发布新型视频学习模型V-JEPA,视频理解新突破
•Meta AI团队推出的V-JEPA模型在无监督视频学习领域取得重大突破。
•该模型通过特征预测原则,利用视频数据直接进行学习,避免了传统方法的依赖。
•V-JEPA在捕捉细微运动细节方面具有优势,展现了其在视频理解中的潜力。
LiblibAI获得数亿元融资,创下融资速度新纪录
•LiblibAI在一年内成功完成四轮融资,创下国内AI应用赛道融资速度的新纪录。
•此次融资再获数亿元资金,进一步巩固了其在行业内的领先地位。
•公司致力于通过AI技术改变创作者的创作方式,建立完整的创作生态链。
Pixverse V4.0更新,新增音效与转绘功能
•Pixverse发布了V4.0版本,增强了底层模型,新增同步生成音效和转绘功能。
•用户可以通过“Restyle”功能将视频风格转换,生成速度和真实感显著提升。
•此次更新为内容创作者提供了更丰富的创作体验,并受到广泛好评。