算子简报
2025-02-26 · 算子简报
通义万相发布新开源视频生成模型Wan2.1
•通义万相推出的Wan2.1模型在Vbench评测中获得86.22%的高分,领先于其他视频生成模型。
•该模型使用3D因果VAE模块和Diffusion Transformer架构,优化了视频生成和推理效率。
•Wan2.1模型仅需8.2G显存即可生成480P视频,提供灵活的开发和部署选择。
360智脑推出Tiny-R1-32B模型,性能接近Deepseek-R1
•360智脑与北京大学联合推出Tiny-R1-32B-Preview模型,参数量仅为5%。
•该模型在数学、编程和科学领域的评测中表现优异,尤其在AIME2024评测中取得78.1分。
•Tiny-R1-32B展示了小型模型在高效推理中的潜力,接近Deepseek-R1的性能。
DeepSeek发布FP8 GEMM库DeepGEMM,助力AI训练与推理
•DeepSeek在开源周第三天推出DeepGEMM,支持FP8通用矩阵乘法。
•该库在NVIDIA Hopper GPU上实现超过1350 TFLOPS的FP8计算性能,核心代码仅300行。
•DeepGEMM旨在为密集型和混合专家模型提供支持,展现出高效与简洁性。
百度无代码开发工具“秒哒”开启用户邀测
•百度于2月25日宣布其无代码开发工具“秒哒”已开启用户邀测,用户可体验H5页面开发等功能。
•该工具具备无代码编程、多智能体协作和多工具调用等特性,提升开发效率。
•申请测试的企业用户数量已突破2万,显示出市场的强烈需求。
谷歌推出超低价AI模型Gemini 2.0 Flash-Lite
•Gemini 2.0 Flash-Lite是谷歌AI模型系列中最具成本效益的选项,旨在为预算有限的开发者提供解决方案。
•该模型在处理大规模文本输出任务时表现出色,定价策略极具竞争力。
•输入和输出tokens的费用远低于市场同类产品,适合高频任务。
幻方量化回应DeepSeek-R2模型提前发布传闻
•幻方量化针对DeepSeek新一代AI模型R2提前发布的传闻作出回应,强调一切以官方消息为准。
•幻方量化于2023年7月成立深度求索AI公司,并在今年1月发布了DeepSeek-R1模型。
•新一代DeepSeek-R2模型有望在代码生成和多语言推理能力上实现提升。
微软开源多模态AI Agent “Magma”
•微软开源了名为“Magma”的多模态AI Agent基础模型,能够处理图像、视频和文本等多种数据类型。
•Magma具备心理预测功能,能够更准确地理解人物或物体的意图。
•用户可通过Magma实现自动下单、查询天气,以及控制实体机器人等智能应用。
OpenAI深度研究功能向所有付费ChatGPT用户开放
•OpenAI扩展了其深度研究功能,向所有ChatGPT Plus、Team、Education和Enterprise用户开放。
•这一功能被认为是自ChatGPT以来最具变革性的AI助手,能够进行复杂的研究任务并生成专业报告。
•中国DeepSeek通过开源新模型挑战OpenAI的订阅商业模式,推动技术普惠。
PhotoDoodle AI让照片变身艺术作品
•字节跳动与中国和新加坡大学研究团队联合推出的PhotoDoodle,利用Flux.1模型重新定义图像创作。
•该技术确保新元素自然融入原始图像,同时研究团队正在探索更高效的单图像训练方法。
•PhotoDoodle能够从少量样本中学习艺术风格并执行编辑指令,提升创作自由度。
OpenAI推出免费高级语音聊天模式
•OpenAI于2月26日在X平台上宣布,ChatGPT的高级语音模式正式向用户免费开放。
•该模式基于GPT-4o mini模型,通过优化计算效率,性能已接近完整版GPT-4o。
•目前支持macOS及Windows 10、11系统的ChatGPT桌面应用程序,提供多种语音选择。
AI特效“快来惹毛我”引发社交媒体热潮
•该特效能够将现实建筑转化为可爱的毛绒玩偶风格,效果可爱逼真。
•特效的简单操作和惊艳效果吸引了众多用户,尤其在高校和文旅机构中广受欢迎。
•用户可通过筛选不同风格的生成图片,确保最终效果更符合个人喜好。
谷歌推出免费AI代码助手Gemini Code Assist
•谷歌发布了Gemini Code Assist for Individuals和Gemini Code Assist for GitHub两款AI代码辅助工具。
•这些工具旨在增强开发者的编码效率,并在市场中与微软的GitHub Copilot竞争。
•Gemini Code Assist for Individuals提供每月18万次代码补全,显著优于GitHub Copilot的免费版。