算子简报
2025-03-04 · 算子简报
智谱推出首个支持汉字生成的开源文生图模型CogView4
•智谱发布了CogView4,这是首个支持生成汉字的开源文生图模型。
•该模型在DPG-Bench基准测试中排名第一,成为开源文生图模型中的SOTA。
•CogView4支持任意分辨率和复杂语义对齐,满足广告和短视频等领域的需求。
MiniMax推出全新图像生成模型Image-01,成本仅为1/10
•MiniMax推出了其首款文本到图像生成模型Image-01,具备卓越的提示控制能力。
•该模型的高效批处理功能和极具竞争力的价格使专业级AI创作更易获取。
•Image-01支持逻辑一致且艺术感十足的图像生成,受到用户广泛关注。
腾讯元宝下载量超DeepSeek,登顶苹果免费App下载榜首
•腾讯元宝在苹果中国区App Store的免费App下载排行榜上取得了显著成就。
•该应用成功超越DeepSeek,成为下载量最高的应用。
•腾讯加大对元宝的推广力度,尤其是在微信平台的曝光。
秘塔AI搜索新增视频搜索功能,提升用户体验
•秘塔网络科技推出了新的AI搜索功能,新增视频搜索模块。
•该功能通过分析大量视频内容,帮助用户更高效地找到所需视频。
•用户可以快速定位到感兴趣的视频,提升了搜索体验。
AI生成3D城市模型GaussianCity,生成速度提升60倍
•南洋理工大学的研究团队推出的GaussianCity技术在3D城市模型生成领域取得了显著突破。
•该技术实现了生成速度的60倍提升,并支持无边界的3D城市生成。
•GaussianCity采用创新的BEV-Point表示方法,显著提升了计算效率和可扩展性。
Ollama大模型工具被指存在严重安全漏洞
•国家网络安全通报中心发布了针对Ollama的安全预警,指出其存在严重安全漏洞。
•专家分析表明,私有化部署用户面临更大风险,可能导致数据泄露和服务中断。
•用户需加强安全意识,及时排查隐患,发现攻击迹象应立即报告相关部门。
超强视频生成模型Wan2.1 GP:低配GPU也能搞定大片
•DeepBeepMeep团队推出的Wan2.1GP是一个针对低端GPU用户优化的视频生成模型。
•该模型在多个基准测试中表现优异,支持多种生成任务。
•Wan2.1GP兼容性强,仅需8.19GB显存,适合低端用户。
火山引擎宣布大模型应用开源,释放AI创新潜力
•火山引擎通过X平台宣布大模型应用正式开源,并推出全新“大模型应用实验室”。
•源应用涵盖手机助手、Deep Research等前沿AI工具,受到用户热议。
•这一举措降低了AI开发门槛,推动行业协作与创新。
QQ浏览器推出“AI作文辅导”功能,助力学生写作
•QQ浏览器推出的“AI作文辅导”功能旨在帮助学生提升写作能力。
•该功能通过全流程的写作技巧辅导,帮助学生在立意、提纲、素材和范文生成的每一步中获得指导。
•QQ浏览器强调多阅读和思考的重要性,鼓励学生掌握写作技巧。
Anthropic融资35亿美元,估值飙升至615亿美元
•Anthropic近日完成了35亿美元的E轮融资,融资后估值达到615亿美元。
•此次融资由Lightspeed Venture Partners领投,显示出投资者对AI市场的持续热情。
•资金将用于推进下一代AI系统的开发,预计年收入在2024年达到了10亿美元。
xAI Grok-3击败GPT4.5,登顶大模型竞技场
•xAI最近推出的Grok-3模型在Chatbot Arena排行榜上表现出色,超越了GPT4.5-Preview。
•该模型在多个领域展现了卓越性能,包括编码、数学、创意写作等。
•Chatbot Arena使用Elo评级系统进行模型排名,标志着xAI在AI领域的显著进展。
雷军在两会建议加强“AI换脸拟声”违法侵权治理
•小米集团创始人雷军在全国两会上提出五项重要建议,推动AI领域的发展。
•他强调完善人工智能终端标准体系的重要性,并呼吁制定以用户体验为导向的标准。
•建议加强对“AI换脸拟声”违法侵权的治理,保护用户权益。