算子简报

2025-03-13 · 算子简报

阿里巴巴全新AI应用“新夸克”正式发布

•阿里巴巴推出了全新升级的AI旗舰应用“新夸克”，整合了多种AI功能。

•该应用基于阿里通义的先进推理与多模态大模型，旨在提供无缝的智能体验。

•新夸克具备智能对话、深度思考和执行能力，满足用户多场景需求。

谷歌发布新一代多模态模型Gemma-3

•谷歌最新发布的Gemma-3模型以其低成本和高性能引起广泛关注。

•该模型支持多种参数规模，最大可达270亿参数，算力需求显著降低。

•Gemma-3在对话模型评比中表现优异，展现强大的语言处理能力。

百度文心快码推出Comate Zulu版本

•百度文心快码推出了Comate Zulu版本，标志着智能编程领域的一次重大突破。

•该版本结合文心大模型的能力，为开发者提供高效的编程体验。

•用户可通过自然语言与系统交流，快速搭建项目和理解代码逻辑。

字节Trae接入硅基流动SiliconCloud

•字节跳动的AI IDE——Trae正式接入硅基流动平台，提升开发者编程体验。

•用户可以通过简单步骤接入多款编码模型，包括DeepSeek-R1等。

•平台提供免费的API服务，助力开发者实现高效开发过程。

谷歌AI Studio再进化，支持YouTube视频解析

•谷歌AI Studio的最新升级允许用户直接通过YouTube链接理解视频内容。

•Gemini2.0Flash模型在视频解析和图像生成方面表现出色。

•该更新标志着谷歌AI Studio向应用级工具的转型，影响现有AI工具生态。

潞晨科技推出Open-Sora 2.0视频大模型

•潞晨科技的Open-Sora 2.0以低成本和强大性能挑战行业标杆OpenAI Sora。

•该模型在多个评测中表现优异，尤其在VBench中与OpenAI Sora的性能差距缩小至0.69%。

•Open-Sora 2.0的训练成本仅为20万美元，显著低于行业标准。

阿里通义新视频生成和编辑模型VACE发布

•阿里通义推出的新视频生成和编辑模型VACE支持运动轨迹控制和主体替换。

•VACE通过文字描述快速生成视频，提升创作效率。

•该模型还具备风格迁移和视频画面智能扩展功能，丰富创作表现。

理想汽车AI助手理想同学网页版上线

•理想汽车推出了其人工智能助手理想同学网页版，进一步扩展智能服务领域。

•该助手接入DeepSeek R1满血版，提供强大的问答能力和跨场景服务协同。

•用户可在不同模型间切换，支持长文本输入及图像问答功能。

谷歌Gemini 2.0 Flash发布多模态图像生成功能

•谷歌Gemini 2.0 Flash引入原生图像生成技术，显著提升生成效率和准确性。

•该模型实现了图像生成与文本理解的直接集成，创作过程更加流畅。

•支持多轮对话式实时编辑，用户可用自然语言提出修改意见。

Remade AI开源8款Wan2.1特效LoRA

•Remade AI在Hugging Face平台推出8款基于Wan2.1模型的开源特效LoRA。

•这些特效模块能够将静态图像转化为动态视频，带来新的创意可能性。

•Wan2.1模型以其高效性和多功能性，成为视频生成领域的顶尖选择。

Captions推出新模型Mirage，提升UGC视频生成质量

•Captions公司推出的Mirage模型能够实时生成UGC风格视频，面部表情与肢体语言真实度高。

•该技术简化了视频制作流程，尤其对广告和内容创作者而言，将成本和时间大幅缩减。

•支持29种语言生成视频，极大简化视频制作流程，降低成本与时间。

谷歌推出Gemini Robotics，赋予机器人更智能的行动能力

•谷歌的Gemini Robotics是一个革命性的机器人控制模型，旨在将AI智慧注入机器人。

•该模型具备强大的多模态理解能力，能够理解文本、图像、音频和视频。

•Gemini Robotics展现出卓越的泛化能力，能够迅速适应新物体和环境。

智谱AI获得珠海5亿元融资，推动技术创新

•珠海华发集团宣布向智谱公司投资5亿元人民币，支持其技术创新与生态发展。

•智谱在融资方面表现优异，去年成功完成多轮融资，总额超过40亿元。

•预计到2025年，智谱将推出全新开源大模型，推动AI行业的繁荣与发展。